veri madenciliğinde regresyon yöntemleri İle doğalgaz sektöründe talep – tüketim ...

15
Veri Madenciliğinde Regresyon Yöntemleri İle Doğalgaz Sektöründe Talep – Tüketim Analizi Servet ÖZMEN Karabük Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı, Karabük Dr. Baha ŞEN Yıldırım Beyazıt Üniversitesi, Mühendislik ve Doğa Bilimleri Fakültesi, Bilgisayar Mühendisliği Bölümü, Ankara

Upload: sutton

Post on 19-Mar-2016

96 views

Category:

Documents


4 download

DESCRIPTION

Veri Madenciliğinde Regresyon Yöntemleri İle Doğalgaz Sektöründe Talep – Tüketim Analizi. Servet ÖZMEN Karabük Üniversitesi , Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı, Karabük Dr. Baha ŞEN - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Veri Madenciliğinde Regresyon Yöntemleri İle Doğalgaz

Sektöründe Talep – Tüketim Analizi

Servet ÖZMENKarabük Üniversitesi, Fen Bilimleri Enstitüsü,

Bilgisayar Mühendisliği Ana Bilim Dalı, KarabükDr. Baha ŞEN

Yıldırım Beyazıt Üniversitesi, Mühendislik ve Doğa Bilimleri Fakültesi, Bilgisayar Mühendisliği Bölümü, Ankara

Page 2: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Sunum İçeriği

• Veri Madenciliği Hakkında• Regresyon Yöntemine Genel Bakış• Doğalgaz Sektörü • Doğalgaz Sektöründe Talep – Tüketim

Tahminlemenin Önemi• Doğalgaz Tahmininde Veri Sözlüğü• Verilerin Kullanılabilirliği• Sonuç

Page 3: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Veri Madenciliği

• Veri madenciliği bilginin keşfine giden yol olarak tanımlanabilir.– Farklı kaynaklardan verilerin toplanması – Verilerin düzenlenmesi– Algoritmaların uygulanması – Sonuç

• Ortak hedef eldeki veriler ile gerçeğe en yakın bulgu veya tahminlemedir.

Page 4: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Regresyon Yöntemine Genel Bakış

• Regresyon Analizi esas olarak değişkenler arasında ilişkinin niteliğini saptamayı amaçlar.

• Bir yada birden daha çok değişkenin başka değişkenler cinsinden tahminleme olanağıdır.

Page 5: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Doğalgaz Sektörü

• Hızla tüketimi artan sektör

• Günümüzde değerli ve stratejik bir enerji kaynağı olarak sıklıkla evlerde ve endüstride kullanılmaktadır.

• Diğer kaynaklara göre uygun

Page 6: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Doğalgaz Sektöründe Talep – Tüketim Tahminlemenin Önemi

• ≈ %95 oranında dışa bağımlılık

• Enerji verimliliği • Denetleme organları

(EPDK)• Cezai uygulamalar

Page 7: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Doğalgaz Tahmininde Veri Sözlüğü

Tahminleme sürecinde RMS-A bazında farklı tüketim değerleri ve tüketim alışkanlıkları gözönüne alınarak veri sözlüğü oluşturulmuştur. Bu nedenle veri hazırlığı aşamasında kendi içinde homojen tahminlerin üretilmesi projenin başarılı bir şekilde sonuçlandırılması adına önemli bir rol oynamaktadır.

DEĞİŞKEN TipExcelVeriID NumerikKonutAbone NumerikKonutBBS NumerikOkulYurtAbone NumerikOkulYurtBBS NumerikResmiKurumAbone NumerikResmiKurumBBS NumerikSaglikAbone NumerikSaglikBBS NumerikSanayiAbone NumerikSanayiBBS NumerikSerbestTuketiciAbone NumerikSerbestTuketiciBBS NumerikTarih KarakterToplamAbone NumerikToplamBBS NumerikTuketimAdapazariRMSA NumerikTuketimAkyaziRMSA NumerikTuketimCamiliRMSA NumerikTuketimHendekRMSA NumerikTuketimKonut NumerikTuketimOkulYurt NumerikTuketimResmiKurum NumerikTuketimSaglik NumerikTuketimSanayi NumerikTuketimSerbestTuketici NumerikTuketimUretimAmacli NumerikUretimAmacliAbone NumerikUretimAmacliBBS Numerik

Page 8: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Doğalgaz Tahmininde Veri Sözlüğü

• Meteorolojik VerilerHavaTarih Ilce T_Ort T_Min T_Maks Nem

Islak Termometre

Sicaklik

RuzgarHizi

RuzgarYonu Durum Basinc Gorus

Mesafesi

2011-07-05 01:00:00.000 Karasu 18,3 NULL NULL 88 18,3 1 220 -99 1012,7 -99

2011-07-05 00:00:00.000 Adapazarı 17,2 NULL NULL 93 16,2 1 230 HAVA AÇIK 1013,4 15

2011-07-05 00:00:00.000 Geyve 14,7 NULL NULL 90 13,1 2 70 -99 1015,4 -99

2011-07-05 00:00:00.000 Karasu 18,9 NULL NULL 90 18,9 3 190 -99 1012,7 -99

2011-07-04 23:00:00.000 Adapazarı 16,8 16,8 17 94 NULL 0,7 199 NULL NULL NULL

2011-07-04 22:00:00.000 Adapazarı NULL 17,6 17,7 NULL NULL 0,6 150 NULL NULL NULL

2011-07-04 21:00:00.000 Adapazarı 17,8 17,8 17,9 92 NULL 0,6 117 NULL NULL NULL

2011-07-04 20:00:00.000 Adapazarı 18,8 18,8 19 90 NULL 1 234 NULL NULL NULL

Page 9: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Verilerin Kullanılabilirliği

Meteoroloji Verileri

Geçmiş Veriler

31.12.2010 tarihine kadar olan

veriler

Xml üzerinden

gelen veriler

Tahmin

Verileri

• HavaDurumID: Benzersiz tablo anahtarıdır.• HavaGelisTarih: Xml formatındaki veride,

verinin alındığı tarih ve saattir. Geçmiş verilerde (31.12.2010 ve öncesi) bu tarih yoktur.

• HavaTarih: Hava durum tarihi ve saatini gösterir. Buradaki saat değeri UTC değeridir. Türkiye saati değildir.

• RuzgarHizi: Geçmiş veride ve xml verisinde rüzgar hızı verisi bulunmaktadır. Bu veri rüzgarın m/s değeridir.

• RuzgarYonu: Geçmiş veri ve xml verisinde rüzgar yönü verisi bulunmaktadır. Geçmiş veride rüzgar yönü pusula değerleriyle bağlantılı verilen değerler, xml formatında gelen verilere eş değer şekle getirilmiş, geçmiş veri xml ile uyumlaştırılmıştır. Buradaki yön kavramında +Y ekseni 0° gösterirken, +X ekseni 90° göstermektedir. –Y ekseni 180° gösterirken, -X ekseni 270° göstermektedir.

Page 10: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Doğalgaz Tahmininde Veri Sözlüğü

• Etkili veriler

IsGunleriID IsGunleriTarihi AboneTuru IsGunuMu TatilNedeni KampanyaKampanyaDerecesi

16537 30.08.2011 00:00 1 1 NULL NULL NULL

16538 30.08.2011 00:00 2 1 NULL NULL NULL

16539 30.08.2011 00:00 8 0 3 NULL NULL

16540 30.08.2011 00:00 9 0 3 NULL NULL

16541 30.08.2011 00:00 10 1 NULL NULL NULL

16542 30.08.2011 00:00 5 0 3 NULL NULL

Page 11: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Verilerin Kullanılabilirliği• Bu veri setinde 01.01.2006 ile 31.12.2021 tarihi arasındaki abone

türlerine göre iş günü olup olmadığı, tatil ise tatil nedeni belirtmiştir.• Buradaki veriler;• IsGunleriID: Takvimin benzersiz anahtarıdır.• IsGunleriTarihi: Takvim günlerini göstermektedir.• AboneTuru: “AboneTuru” tablosununa bağlı olarak gelen benzersiz

tanımlardır.• IsGunuMu: Takvim gününün iş günü olup olmadığını gösterir. Buradaki

“0” değeri tatil olduğunu, “1” değeri iş günü olduğu, “2” değeri ise yarım iş günü olduğunu göstermektedir. Dini bayram tatilleri 2015 yılına kadar bulunabildiği için, bu tarihe kadar girilmiştir.

• TatilNedeni: Bu alan tatil varsa nedenini göstermektedir. Buradaki değer “Tatiller” tablosundaki TatillerID ile eşleşmektedir.

Page 12: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Verilerin Kullanılabilirliği

• Veriler ile ilk çalışmayı SAS programı ile yapılmıştır. Fakat ücretli bir program olduğundan projenin devamında Weka ortamında open source kaynak kodlu program ile devam edilecektir.

Page 13: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Sonuç

Page 14: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Sonuç

• Sonuç olarak, günlük tahmin sonuçları oluşmaktadır. Tahmin sonuçları, yarın ve sonra ki haftayı tahmin etmektedir.

• Regresyon analiziyle talep – tüketim analizleri hata oranı düşük olarak tahminlemeleri çok yüksek derecede tutmaktadır.

• Hata payı oran ortalaması ilk çalışmamızda %9,4 oranında çıkmıştır.

• Bu oran verilerin kalitesi arttıkça düşmektedir.• Raporlar 3 kırılımda alınabilmektedir.

Page 15: Veri  Madenciliğinde  Regresyon  Yöntemleri İle Doğalgaz Sektöründe  Talep  – Tüketim  Analizi

Teşekkürler…