veri madenciliği ve makine Öğrenmesi konularına giriş

61
Veri Madenciliği, Bilimi, (Data Mining) Şadi Evren ŞEKER

Upload: sadi-evren-seker

Post on 11-Apr-2017

149 views

Category:

Data & Analytics


4 download

TRANSCRIPT

Page 1: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

VeriMadenciliği,Bilimi,(DataMining)

ŞadiEvrenŞEKER

Page 2: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

January13,2017 2

Doç. Dr. Şadi Evren ŞEKER Eğitim: Bilg Müh. BSc. , MSc. 7Tepe Ünv.

M.A. İTÜ STS, PhD. Yıldız Teknik Bilg. Müh. , PostDoc UT Dallas Comp. Sci.,

İstanbul Şehir Üniversitesi, Yönetim Bilişim Sistemleri. Smith College, Computer Science

6 Farklı Ülkede 17 Farklı üniversitede ders vermek www.SadiEvrenSEKER.com

YouTube:Bilgisayar Kavramları ©2016 Şadi Evren ŞEKER, bütün hakları saklıdır.

Page 3: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

January13,2017 DataMining:ConceptsTechniques 3

www.SadiEvrenSEKER.com

Page 4: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

www.BilgisayarKavramlari.com

January13,2017 DataMining:ConceptsandTechniques 4

Page 5: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

YouTube:BilgisayarKavramları

January13,2017 DataMining:ConceptsandTechniques 5

Page 6: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

HypeCycle2014Gartner

Page 7: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Page 8: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Page 9: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Page 10: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

DayanılanDisiplinler

Page 11: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Page 12: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Page 13: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Page 14: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

İşZekası(BusinessIntelligence)

Page 15: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

VeriOlgunluğu

UygulamaKatmanı

VeriTabanları

ArayüzKatmanları

•  VeriCahilliği(olgunluk0.0)•  Yöne_minönündeçalışanlar(olgunluk

0.5):Excel,mikrouygulamalar•  VeriFarkındalığı(olgunluk1.0):Veri

Tabanı/Dosya•  Veriyietkilihalege_rmek(olgunluk1.5):

Viewkullanımı•  EtkiliVeriArayışı(olgunluk2.0):Veri

Ambarları•  Probleminfarkınavarma(olgunluk2.5)•  Bütünveriyaanındaveheramaçiçin

erişim(olgunluk3.0):BüyükVeri

Page 16: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

VeriOlgunlukSeviyeleri

•  1.VeriBirVarlıkfr•  2.VeriTabanları(RDBMS)•  2.5.ViewYapıları•  3.VeriAmbarları•  3.5.GelişmişMartlar,VeriKüpleriveOLAPin-memory

•  4.BüyükVeri,NoSQLveBulut

16

Page 17: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Page 18: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

BazıUygulamaAlanları

•  FinansalVeriAnalizi•  ParekendeSektörü•  Telekom•  BiyolojikVeriler•  SaldırganYakalanması•  SosyalAğlar

Page 19: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Finans/PazarlamaAlanı

•  MüşteridavranışlarıveKrediKarfharcamaları•  Borsavediğerfinansalaraçlarınanalizi•  Karaparaaklama•  Hedeflenmişpazarlama•  XRM•  CustomerChurnAnalysis•  SigortaPirimleri

Page 20: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

ParekendeSektörü

•  Çokboyutluraporlar(müşteri,ürün,zaman,şubevs.)

•  Kampanyaoluşturma/başarısı/Analizi•  Ürüntavsiyeleri•  Rafanalizleri

Page 21: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

TelekomSektörü

•  Hileliaramalarınyakalanması•  Müşteriprofillemesi•  CRM•  CustomerChurnAnalysis•  Görselleş_rme

Page 22: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Biyoenforma_k

•  Proteinveyagendizilimlerininanalizi•  Görselleş_rme•  Proteinveaygenlerinindekslenmesi,kategorilenmesiveyaaranması

Page 23: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

SaldırganlarınYakalanması

•  Akanverininanalizi•  Davranışanalizi•  Monitorvealarmmekanizmaları•  Görselleş_rmevesorguaraçları

Page 24: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

SosyalAğAnalizi

•  Hareketliortamınmodellenmesivetahmini•  Yazartanıma•  Grupvearkadaşlıkanalizleri•  Davranışanalizi(tepkiler)•  Argümanvetrendler

Page 25: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

NORA

Page 26: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Page 27: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Trendler•  Applica_onExplora_on.•  Scalableandinterac_vedataminingmethods.•  Integra_onofdataminingwithdatabasesystems,datawarehouse

systemsandwebdatabasesystems.•  Standardiza_onofdataminingquerylanguage.•  Visualdatamining.•  Newmethodsforminingcomplextypesofdata.•  Biologicaldatamining.•  Dataminingandsorwareengineering.•  Webmining.•  Distributeddatamining.•  Real_medatamining.•  Mul_databasedatamining.•  Privacyprotec_onandinforma_onsecurityindatamining.

Page 28: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Trendler•  Applica_onExplora_on.•  Scalableandinterac_vedataminingmethods.•  Integra_onofdataminingwithdatabasesystems,datawarehouse

systemsandwebdatabasesystems.•  Standardiza_onofdataminingquerylanguage.•  Visualdatamining.•  Newmethodsforminingcomplextypesofdata.•  Biologicaldatamining.•  Dataminingandsorwareengineering.•  Webmining.•  Distributeddatamining.•  Real_medatamining.•  Mul_databasedatamining.•  Privacyprotec_onandinforma_onsecurityindatamining.

VeriMadenciliği,Verininolduğuheryerdedir.

Page 29: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

29

VeriMadenciliğiveBazıProblemler

•  Verininbüyüyenhızıhergeçengündahadayakalanamazolmaktadır.

–  Verininbüyüyenhızıönceleribüyükveriyitanımlarkenarfkbüyükveri5Volaraktanımlanmaktadır.

•  Veriyitoplamak,saklamakveişlemekiçinotoma_zeedilmişaraçlaraih_yaçartmaktadır

–  Geneldeverininbolcabulunduğualanlar•  İşDünyası:Web,E-Ticaret,Safş/Banka/Süreçİşlemleri(Transac_ons),Borsa,PAZARLAMA!!!!…

•  Bilim:UzaktanAlgılama,Biyoinforma_k,simülasyonlar,…

•  ToplumveHalkiçin:Haberler,DijitalKameralar,YouTube,..

•  Bolcaveriiçerisindeyüzüyoruzamaçoğuzamanbilgidenyoksunuz.

•  Buluşlar ihtiyaçlardan doğar!

Page 30: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Data Warehouse: A Multi-Tiered Architecture

Data Warehouse

(Veri Ambarı)

Extract Transform Load Refresh

OLAP Engine

Analysis Query Reports Data mining

Monitor &

Integrator Metadata

Veri Kaynakları Front-End Tools

Serve

Data Marts

Operational DBs

Other sources

Data Storage

OLAP Server

Page 31: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

ETL

Extract(Çıkarım)

PreProcess(Temizleme)

Transform(Dönüşüm)

Load(Yükleme)

VeriTaban(lar)ı

VeriAmbarı

KabulEdilmeyenVeri

Kademe-Sahne(StagingArea)

KabulEdilmeyenVeri

Page 32: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Meslekler–NeredenBaşlamalı?

NoVeriTabanı

NoSQL

DataMining

Visualiza_on(BI)

NoDBA

YazılımGeliş_rmeUzmanı

VeriBilimcisi

Görselleş_rmeGü

venlik

SysO

p/D

evOp/S

ysAdm

in

MaliyetHesabı

VeriSahipliği(governance)

BüyükVeriYöne_mi

ProjeYöne_mi

YazılımProjeYöne_cisi

Page 33: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

PazarPaylarıveTeknolojiler

Page 34: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

2015BigData

Page 35: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Page 36: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Büyüme

Page 37: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Page 38: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

İşRolleri

Page 39: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Web 1.0 Info – Centric Web

•  The first generation of the World Wide Web (WWW), characterized by separate static websites.

•  It is one-way broadcasting.

•  It is invented 1989 by Tim Berners- Lee.

•  It was widely used between 1998 and 2001, and it is still used beside Web 2.0 in almost all web sites.

Page 40: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Web2.0PeopleCentricWeb

!  TechnologiesandTrends!  Socialnetworkingsites:

! Facebook,MySpace,Hi5,…etc.

!  TaggingorLabelingContent:! Del.icio.us.

!  Wikis:! Wikipedia.

!  Community-generatedcontent:! eBay.

!  OpenServices:

! Google.!  P2P:

! BitTorrent.!  NewWebtechnologies:

! XML,RSS,Ajax.!  OpenSourceSorware

Page 41: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Web3.0MachineCentricWeb

•  Different meanings are intended to describe the evolution of Web usage and interaction between the many possible evolutionary paths.

•  The third generation of Web technologies and services that emphasize a machine-facilitated understanding of information on the Web.

Page 42: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Web 3.0 Evolution Paths

•  Semantic Web •  Intelligent System Planning •  Business and Network Applications •  … etc.

•  Video Web •  Web 3D •  Ubiquitous and Pervasive Web

Page 43: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Web 3.0 Semantic Web

•  It is a group of methods and technologies to allow machines to understand the meaning - or "semantics" - of information on the World Wide Web.

•  The semantic web is a vision of information that is understandable by computers, so computers can perform more of the tedious work involved in finding, combining, and acting upon information on the web.

Page 44: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Semantic Web The Technology

•  It involves publishing in languages specifically designed for data: Resource Description Framework (RDF), Web Ontology Language (OWL), and Extensible Markup Language (XML):

! HTML describes documents and the links between them.

!  RDF, OWL, and XML, by contrast, can describe arbitrary things such as people, meetings, or airplane parts.

Page 45: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Web3.0Web2.0Web1.0

NowBefore Future

Page 46: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Web3.0Web2.0Web1.0

NowBefore Future

Page 47: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Web3.0

Page 48: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

VeriMadenciliğiGelişimAşamaları

•  Descrip/veAnaly_cs,whichusedataaggrega_onanddataminingtechniquestoprovideinsightintothepastandanswer:“Whathashappened?”:SocialAnaly_cs(SummarizeData)

•  Predic/veAnaly_cs,whichusesta_s_calmodelsandforecaststechniquestounderstandthefutureandanswer:“Notonlyfuturealso,Whatcouldhappen?”:Sen_mentalAnalysis,

•  Prescrip/veAnaly_cs,whichuseop_miza_onandsimula_onalgorithmstoadviceonpossibleoutcomesandanswer:“Whatshouldwedo?”,RecommenderAlgorithms

January13,2017 DataMining:ConceptsandTechniques 48

Page 49: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

January13,2017 DataMining:ConceptsandTechniques 49

Architecture:TypicalDataMiningSystem

data cleaning, integration, and selection

DatabaseorDataWarehouseServer

DataMiningEngine

Pa{ernEvalua_on

GraphicalUserInterface

Knowledge-Base

Database Data Warehouse

World-Wide Web

Other Info Repositories

Page 50: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

BüyükVeri?

•  Bilgisayarişlemekapasitesi•  5V

Page 51: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

BüyükVeriveMap-Reduce

•  Büyükveriiçinkri_kşartlar:– Map– Ölçeklenebilirlik(Scalability)– ProbleminDağıflabilirliği

•  ParalelProgramlama•  DağıfkSistemler

– VeriGeçişi– Reduce

Page 52: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

MapReduceNedir?MAP

Page 53: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

MapReduceNedir?Reduce

Page 54: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

MapReduceNedir?

Page 55: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

WordCountÖrneği

Page 56: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

NoSQL

•  Scalability(Ölçeklenebilirlik)vebüyümeninkontroledilmesi

•  Coğrafilimitlerinkalkması•  SchemeonRead•  LazyUpdate(OLTPsistemideğildir,kesinlikledeğildir!)

•  Örneksosyalağlar

Page 57: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

NoSQLNeSağlar?

•  Yerelverierişimi•  Verilerinyapısızolması(unstructured)•  Verigüncellemesindegereksizaşamalarınazalflması

•  DDOSkoruması

Page 58: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

BigDataandDataMiningProblems

•  Classifica_on•  Clustering•  Associa_onRuleMining•  Predic_on

Page 59: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

OracleBigDataMimarisiÇalışfrma(Execu_on)

Yenilik(Innova_on)

VeriEntegrasyonu

Page 60: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

İle_şim

•  ŞadiEvrenŞEKER•  www.SadiEvrenSEKER.com•  www.MISSozluk.com•  www.BilgisayarKavramlari.com•  www.YBSAnsiklopledi.com•  YouTube:BilgisayarKavramları•  CurrentAffilia_on:İstanbulŞehirÜniversitesi

Page 61: Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş

Soru-Cevap

•  YouTube:bilgisayarkavramları•  Mail:[email protected]•  Konular:Akademikhayat,bilişimsektörü,büyükveri,işhayaf,verimadenciliği,mahremiyet,sosyalağlar,kariyerplanlaması,öğrencilik,bilgisayarmühendisliği,veritabanları,nosql,yurtdışı(çalışmak/öğrencilik)