data mining (concepts, applications, techniques, tools, process, experiences) - داده کاوی...
TRANSCRIPT
![Page 1: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/1.jpg)
احسان عسگریان: ارائه دهنده
9/27/2016
1
![Page 2: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/2.jpg)
حجمذخيرهبرايمتعددابزارهايودادهپايگاههايسيستمگسترشهادادهباالي
ونيانسانيروينظرازدادهانبوهحجمرويعملياتانجامبااليهزينهمحدوديت-2،کاروکسبکلباآشناخبرهنيرويکمبود-1)مادي
(دادهبااليحجمبابرخورددرانسانخطايوناتوانيحافظه،
کمبودوليداريماختياردرکهاطالعاتودادهبااليحجموجودباميشوداحساسبشدتدانش
کاربردخالتکمترينبادانشکشفبرايخودکارروشهاييبهنياز
9/27/20162
![Page 3: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/3.jpg)
1960ازتوسطدادههاجمعآوريومديريتسيستمهايايجادIBM, CDC
وکامپيوترهاديسکهارويدادههاذخيره(سالگذشته5محاسبهکلسوديکفروشگاهدر)بازيابيايستا
1970ازدادههايرابطهايطراحيمدلپايگاهايجادپايگاهدادههايرابطهاياوليهايجادزبانپرسوجوبرايتهيهگزارشاتازپايگاهداده(زانهميزانفروشيککاالدريکشعبهبصورترو)بازيابيپويادرسطحرکورد
1980از(توسعهمدلرابطهاي،مدلهايشيگرا،)دادههاپايگاهمدلهايپيشرفتهطراحي...شاخصگذاريوسازماندهيدادههاباDBMSهايDB2،Oracle،Sybase
(دادههايمکاني،مهندسي،)کاربردايجادپايگاهدادههايوابستهبه...بازيابيپويابهينهسازي
9/27/20163
![Page 4: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/4.jpg)
1990ازچندبعديدادههايپايگاهايجادData WarehouseوOLAP
بازيابيپويادرچندسطح(باامکانDrill Down)OLAPاقبگويدچرااتفنميتوانداطالعاتکامليازرخدادهايگذشتهميدهد،ولي
.کندپيشبينيافتادهويا(دادهکاوي)پيدايشايدههاياوليهکاوشواستخراجدانشازانبارهدادهها
2000ازابزارهايپيشرفتهمانندSPSS/Clementine, SGI, SAS
دادههاوسيستمهاياطالعاتيعموميکشفالگوهايجديددرپايگاهبازيابيپويابانگاهپيشروبهآينده؟فروشيککاالدرماهآيندهدريکشعبهخاصچقدراست؟وچرا
درحالحاضر(دادهکاويپويا)دادهکاويبررويکالندادهوجرياندادههاويدئو،متن،تصوير)کشفالگوهايجديددرمنابعناهمگونوبوشبکههاياجتماعي،
(صداتحليلنظراتوسليقهشخصيمشتريان،تحليلبازاربورسو...بازيابيپوياولحظهاياطالعاتمتناسبباکاربردهايخاص،دادههاينامتوازنو...
9/27/20164
![Page 5: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/5.jpg)
9/27/20165
![Page 6: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/6.jpg)
“…The non-trivial process of identifying valid,
novel (previously unknown), potentially useful,
and ultimately understandable (implicit)
patterns in data…”
Fayyad, Piatetsky-Shapiro, Smyth [1996]
data source: databases, texts, web, images, video, etc.
9/27/20166
![Page 7: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/7.jpg)
Statistics
MachineLearning
Databases
Visualization
Data Mining and
Knowledge Discovery
9/27/20167
![Page 8: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/8.jpg)
Data Analysis Tests for statistical
correctness of models Are statistical assumptions
of models correct? Eg Is the R-Square good?
Hypothesis testing Is the relationship
significant? Use a t-test to validate
significance
Tends to rely on sampling Techniques are not
optimised for large amounts of data
Requires strong statistical skills
Data Mining Originally developed to
act as expert systems to solve problems
Less interested in the mechanics of the technique
If it makes sense then let’s use it
Does not require assumptions to be made about data
Can find patterns in very large amounts of data
Requires understanding of data and business problem
9/27/20168
![Page 9: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/9.jpg)
(گيگاياترابايت)حجمانبوهدادهاستنمونهگیریآماریمبتنیبرروشهای.
باحجمزيادوباابعادمختلفدادههايژنتیکیعکسها،دادههایووب،تصاویر
دادههاهناشناختهمفيدازدرونحجمانبوالگوهايکشفاطالعاتنهفتهووتسهاازدادهاییرمجموعهزارتباطمیانبرایتوصیفالگویمفید،مدلی
.معتبر،ساده،قابلفهموجدیداست
پيچيدهتروروابطدادههاحجمبيشتردسترسیبهاطالعاتنهفتهدرمیاندادههامشکلترنقشدادهکاویروشنتر
9/27/20169
![Page 10: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/10.jpg)
مخفيدردادهها(الگوهايجالبتوجه)جستجوبرايدانش
9/27/201610
![Page 11: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/11.jpg)
9/27/201611
![Page 12: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/12.jpg)
Increasing potential
to support
business decisions End User
Business
Analyst
Data
Analyst
DBA
Making
Decisions
Data Presentation
Visualization Techniques
Data Mining
Information Discovery
Data Exploration
OLAP, MDA
Statistical Analysis, Querying and Reporting
Data Warehouses / Data Marts
Data SourcesPaper, Files, Information Providers, Database Systems, OLTP
![Page 13: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/13.jpg)
9/27/201613
Data
Warehouse
Data cleaning & data integration Filtering
Databases
Database or data warehouse server
Data mining engine
Pattern evaluation
Graphical user interface
Knowledge-base
![Page 14: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/14.jpg)
هادادهپردازشحجمانبوهبازيابيوحجمبااليدادههاابعادبااليدادههاطبيعتتوزيعشدهدادههادادههاطبيعتناهمگن
ونرمالسازي،تبديل)نامناسبدادهومختلفيفرمتها
...(پااليشداده،کدگذاريو
یژگیهایوعریفمختلفازقبیلتهایتکنیکعملیاتونیازبهودموجویژگیهایجدیدباانجامعملیاتریاضیومنطقیروی
9/27/201614
![Page 15: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/15.jpg)
امخبيکيفيتياگمشدهدادههاينامعتبرومقاديرادهمختلفبرایپاکسازیدالگوریتمهایوروشهااستفادهاز
دادههاويکپارچگيبروزرساني
حفظحريمشخصيدادهها
حجمبااليدادههاودادههايجريابي
کاوشانتخابروشهايکارابراي
9/27/201615
![Page 16: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/16.jpg)
وقايعآيندهبراساسروندگذشتهپيشبيني
يالگوبرايشناسايطبقهبندياشياء،افراديااتفاقات
يهاويژگوافرادبراساسصفاتودستهبندياشياء
وقايعيکهاحتمالداردهمزمانرخدهندشناسايي
شودميوقايعيکهيکيباعثوقوعديگريشناسايي
9/27/201616
![Page 17: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/17.jpg)
9/27/201617
3832
20 17 14 13 13 13 12 12 12 11 11 10 9 8 8 8
CRM/Consumer analytics BankingFraud detection2 financeDirect Marketing OtherInvestment Credit ScoringTelecom RetailAdvertising BiotechScience InsuranceHealth care E-Commerce
http://www.kdnuggets.com/polls/2008/data-mining-applications.htm
![Page 18: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/18.jpg)
کمکبهمديريتارتباطبامشتريچينشمحصوالتتحليلسبدخريدو(ترياننيازوعالقهمشکاالهايمورد)موردنيازبهمشتريانمحصولپيشنهادشناساييعواملموثردرجذبمشتريانجديد(ازنظرعاليق،سطحدرآمد،)مختلفمشترياندستهبنديمدلهاي...(هايخريدتعيينالگو)بازاريابيوتبليغاتمتناسبباسليقههرمشتري
پيشبينيميزانفروشمحصوالت
تدارکاتسفارشاتوتجديدفروش،خريدو(برنامهريزيانبار)وانبارداريکاالبهينهسازيتجارتونقلومديريتحملتوزيعوتدارکاتکاال
9/27/201618
![Page 19: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/19.jpg)
مشتريانبرايبهبودسرويسهاتحليل
ريسکانواعمشتريانوبيمههاتحليل
مشتريانجديدتوسطنامههايبيمهخريدپيشگوييميزان
تشخيصمواردمشکوکبهتقلب
حليلشناساييعواملتاثيرگذاربررضايتمشتريانبهکمکت
مشتريان(وفاداري)ميزانماندگاري
9/27/201619
![Page 20: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/20.jpg)
تحليلسودبخشيمشتريان
(برايوام)مشتريمديريتاعتباربراساسردهونوع
هخدماتبتحليلسرويسهايمختلفبانکيبرايبهبودفرآيند
مشتريان
تشخيصمشتريانثابتومعتبر
شناساييحسابهايدارايگردشماليمشکوک
الگوهايکالهبرداريازطريقسابقهتراکنشهاپيشبيني
9/27/201620
![Page 21: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/21.jpg)
بيمارانميزانموفقيتاعمالجراحيبراساسشرايطپيشبيني
شناساييعللوعواملموثردربروزبيماريها
تشخيصنسبيبيماريهايخاصباتوجهبهعالئم
پيشنهادداروييوپيشبينيتاثيرداروهابربيمار
شناساييروابطبينبيماريهادرطولزمان
9/27/201621
![Page 22: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/22.jpg)
بهينهسازيمسيروايستگاههايوسائلنقليهعمومي
شناسااييمسايرهاوزمااناوجترافياک)تحليلدادههاايمکااني،...(بهينهسازيمکاندوربرگردانهاو
ي،اناواعحادثاهخساارت)نقاطحادثهخيزشاهريتحليلوشناساييوتشخيصعواملموثربرآن(جرحي،منجربهفوت
پيشبينيخادماتحمالونقالعماوميدرونشاهريماوردنياازشهروندان
زمانبنديوتنظيمهوشمندچراغقرمزچهارراهها
زمانسفربراساستحليل(پيشنهادمسيرهوشمند)مسيريابيپويا
9/27/201622
![Page 23: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/23.jpg)
فروشوشناسايينيازمنديهاپيشبينيبرنامهريزيانبارنقلمديريتحملوقطعاتدرآيندهبرايسفارشاتوتامينپيشنهادکاالوتدارکاتمديريتکميوکيفينحوهتوزيعوتحليل
(تحليلرضايتونيازمشتريان)عواملموثربرجذبسفارش
رقابتتحليلرفتاروجهتشرکتهايرقيبدستهبنديمشتريانورويهقيمتگذاريبرايهردستهتعييناستراتژيقيمتگذاريبرايرقابتدربازار
9/27/201623
![Page 24: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/24.jpg)
يکپارچهسازيمجموعهدادههايناهمگونزيستيبکهپروتئينهاياروابطدرش(چهارم/سوم/دوم/اول)پيشبينيساختار
ژنومواليهايتحليلالگوهايتکرارشونده،ترازبندي،تشخيصويژگيدرت
ژنيوپروتئينيابزارهايمجسمسازيوتحليلدادههايزيستي
9/27/201624
![Page 25: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/25.jpg)
(آوريازنظررفتاريياسود)مشتريانوتقسيمبنديشناسايي
(لترگذاريفي)شناساييالگوهايمشکوکبهتقلبياسوءاستفاده
لافمشاتريانمخت(ماوردعالقاه)پيشبينيسرويسهايموردنياز(يآنهاتبليغاتوپيشنهادبهمشتريانبرحسبنيازوعالقمند)
وفااداريتحليلماندگارييا)شناساييعواملموثردررضايتمشتريان(مشتريان
9/27/201625
![Page 26: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/26.jpg)
تحليلالگوهايدادههايجرياني
تعيينعواملوويژگيهايموثردرانواعحمالت
شناسايياعماليادرخواستهايغيرمتعارفدرشبکه
ابزارهااايمجسمسااازيعملياااتکاااربرانوانااواعمنااابعمااورددرخواستآنهادرطولزمان
9/27/201626
![Page 27: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/27.jpg)
دستهبنديياخوشهبنديمتونتعيينموضوعخبريادستهبندياخبارشناساييهرزنامههادرپستالکترونيکبازيابياطالعاتمرتبطبايکمفهوم
متناستخراجاطالعاتاز
تعيينشباهتمتون(سرقتادبي)کشفتقلبنگارشييوناداريدرسيستمهاياتوماسپيگيرينامههايمرتبطيادستوراتمشابهجستجويبخشنامههاوآييننامههادرسيستمهاياتوماسيوناداريتشخيصنويسندهمتن
9/27/201627
![Page 28: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/28.jpg)
1اشتباه:مجموعهايازابزارهاکهدادههايناقصراتکميلميکند.
1واقعيت:دادهکاويابزارنيستبلکهيکفراينداست(CRISP-DM)هاييابزارهاييکهبرايدادهکاوياستفادهميشوندبهتن
.نميتوانندمشکلدادههاراحلکنند
9/27/201628
![Page 29: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/29.jpg)
2اشتباه:بومستقلازکس)يکفرايندخودمختاروازقبلمشخصاست
(کاررباکميتغييرروشوتکنيک،دادهکاويقابلاستفادهد
سازمانهايمختلفاست
2واقعيت:درهرفازدادهکاويبشدتبهدخالتفردخبرهنيازدارداشدبعدازايجادمدلاوليه،نيازبهبروزرسانيواصالحآنميب
9/27/201629
![Page 30: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/30.jpg)
3اشتباه:سودناشيازدادهکاويبهسرعتهزينههايخودراجبران
ميکند
3واقعيت:نرخبازگشتسرمايهپروژههايدادهکاويبسيارمتغيرهست(متفاوت)يلبازگشتسرمايهدادهکاويبستگيبهعواملزياديازقب:
نه،هزي(شخصخبره)ميزانهزينهراهاندازي،هزينههايپرسنليدارد...آمادهسازيدادهها،اهميتحوزهکسبوکارو
9/27/201630
![Page 31: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/31.jpg)
4اشتباه:نرمافزارهايدادهکاويبراحتيقابلاستفادهاست
4واقعيت:کهدرنرمافزارهاپيادهسازي)تکنيکهايعموميدادهکاوي
.ندبراحتيقابلاستفادهبرايپروژههايمختلفهست(شدنددانشوليتحليلدادههاوهدفدادهکاويبايدترکيبياز
منهشناختداودربارهتکنيکها،روشهاوکاربردهايدادهکاوي.باشدمسئلهخاص
9/27/201631
![Page 32: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/32.jpg)
5اشتباه:دمشکالتدرونکسبوکارسازمانراشناساييميکن(علت)دادهکاويدرکسبوکاربادادهکاويحل(نقاطمبهموپرسشها)همهمشکالت
.ميشود
5واقعيت:فرايندکشفدانشبسياريازالگوهايرفتاريراپوششنميدهد.تنتاجاس(فردخبرهمانندمدير)نتايجفراينددادهکاويبايدتوسطانسان
سازمانمشخصگردد(کسبوکار)شدهودليلمشکالتمتعريفوانجافراينددادهکاويباتوجهبهاهدافکسبوکارسازمان
.ميشود
9/27/201632
![Page 33: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/33.jpg)
6اشتباه:دادهکاويبصورتخودکاردادههاراپاکسازيوآمادهميکند
6واقعيت:اغلبدادهکاويبررويدادههايسيستمهايقديميکارميکند
خيلياوقاتنظارتودقتزياديبرروياينوروددادههانبودهواينهستند...دادههاناقص،حاويفيلدهايخالي،نويز،ناسازگاريو
تدادههاس(آمادهسازي)مشکلترينفازدادهکاوي،فازپيشپردازش
9/27/201633
![Page 34: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/34.jpg)
7اشتباه:دادهکاوييکفرايندآنالينباابزارهايازپيشآمادههست.
7واقعيت:دادهکاوييکفرايندکامالًآفالينوتکرارياست
يآمادهابزارهاي(الگوريتمهاوتکنيکها)تنهابرايبرخيمراحلرهاغلبمراحلفراينددادهکاويبهدانششخصخب.شدهاست
.وابستگيدارد
9/27/201634
![Page 35: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/35.jpg)
برايکاويمناسبداده:دادههاداردجديدوارتباطبينالگوهايکهنيازبهشناساييحوزهايهر.دادههااحساسشود(خالصهسازيوتوصيف)نيازبهگروهبندي.نيازبهپيشبينيپديدههاومشخصکردننيازهايآتينيازبهتحليلوبررسينتايجحاصلازانجاميارخداديکپديدهتحليلعلتوويژگيهايموثردررخداديکپديده
موفقدادهکاوي:شرايطاصليدادهها:
(تعدادکافينمونهها)زيادحجم،(ثبتويژگيهايمتناسبباهدف)کافيبودنويژگي،(بدونفيلدخالي)،کامل(بدونغلطونويز)کيفيتبا،(واقعي)معتبردادهمنابع:صحتداده
(باتوجهبهدادههاوهدفسازمان)کاويروشصحيحدادهانتخاب
9/27/201635
![Page 36: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/36.jpg)
36
![Page 37: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/37.jpg)
9/27/201637
روشهایدادهکاوی
(بدونناظر)توصیفکنندهDescriptive
(Clustering)خوشهبندی
Association)کشفقوانینوابستگی
Rule Mining)
Sequential)کشفالگوهایترتیبی
Pattern Discovery)
(رباناظ)پیشبینیکنندهPredictive
(Regression)رگرسیون
(Classification)دستهبندی
Deviation)تشخیصوکشفتقلب
Detection)
![Page 38: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/38.jpg)
38
oيادگيرينظارتنشدهoوصياتبراساسخصبهتعداديخوشهنامتجانسدادههايطبيعيگروهبندي
مشابهoههادستپيوستگيداخليهردستهوهمبستگيخارجيکمباسايرoدادههاايبراساسنزديکيفاصالهمياانرکوردهااودرصادقارارگارفتن
خوشههاوروديدر
oتفاوتباطبقهبنديکاردرشروعهاخوشهنامعينبودن–
9/27/2016
![Page 39: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/39.jpg)
وده و پیدا نمودن گروه های اشیاء بطوریکه اشیاء درون هر خوشه شبیه یکدیگر ب.اشیاء خوشه های مختلف متفاوت یا غیرمرتبط یا یکدیگر باشند
Inter-cluster distances are maximized
Intra-cluster distances are
minimized
![Page 40: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/40.jpg)
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
0
0.5
1
1.5
2
2.5
3
x
y
Iteration 1
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
0
0.5
1
1.5
2
2.5
3
x
y
Iteration 2
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
0
0.5
1
1.5
2
2.5
3
x
y
Iteration 3
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
0
0.5
1
1.5
2
2.5
3
x
y
Iteration 4
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
0
0.5
1
1.5
2
2.5
3
x
y
Iteration 5
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
0
0.5
1
1.5
2
2.5
3
x
y
Iteration 6
![Page 41: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/41.jpg)
p4
p1p3
p2
p4
p1 p3
p2
p4p1 p2 p3
p4p1 p2 p3
Traditional Hierarchical Clustering
Non-traditional Hierarchical Clustering Non-traditional Dendrogram
Traditional Dendrogram
![Page 42: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/42.jpg)
42
معايبافزونگينامناسببرايدادههايباخصوصياتنامربوطودارايدقتکمترازروشهايديگر
کاربردتقسيمبنديبازارمحصولشناساييمشتريانبازاريابيمستقيمخوشهبندياسناد
9/27/2016
![Page 43: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/43.jpg)
43
عهکشفوتوليدالگوهاييکهوقوعيکرخدادرابراساسواقديگرپيشگوييکند
TID Items
1 Bread, Coke, Milk
2 Beer, Bread
3 Beer, Coke, Diaper, Milk
4 Beer, Bread, Diaper, Milk
5 Coke, Diaper, Milk
Rules Discovered:
{Milk} --> {Coke}
{Diaper, Milk} --> {Beer}
Supportتراکنشهايخريدازدرصد/.0001تنهادر
نابراينبداشتند،،شيروپيچگوشتيباهم:ناستدرجهپشتيبانيبرايقانونزيرپايي
"شير→ پيچگوشتي"
Confidence%80"نان→ پنير"درجهاطمينانقانون
تراکنشهايخريد،اگرنان%80در.است.پنيرنيزوجودداردباشد،وجودداشته
9/27/2016
![Page 44: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/44.jpg)
44
مديريتموجوديوانبار
تبليغاتوبازاريابيچندکاال
مديريتچيدمانقفسههايفروشگاه
سيستمهايتوصيهگر
9/27/2016
![Page 45: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/45.jpg)
شناساييترتيبوقايعبراساساطالعاتگذشتهمشتريانکهکتخاکستريخريدهاند،ششماهبعد%1:40مثال
.شلوارمشکيخريدهانديابديکماهبعدازفروشسيستم،فروشنرمافزارافزايشمي:2مثال.
نيازبهدادههايکامل،دقيقومعتبر
نتيجهبرنامهريزيتوليدبهترمديريتبهينهانبار
9/27/201645
![Page 46: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/46.jpg)
46
متغیرهاایرسبراساسپیوستهمتغیریکپیشبینی•یغیرخطیاخطیوابستگیمدلیکمبنایبر
حلیلمثلت)متغیراصلیزماناست:پیشبینیسریزمانی(اتغییراتسهامدردادههابورسیاتغییروضعیتآبوهو
وشپیشبینیمیزانفروشیکمحصولجدیدبراساسفریغاتمحصوالتمشابهدرگذشته،مشخصاتآنهاومیزانتبل
انجامشدهبرایآنها
9/27/2016
![Page 47: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/47.jpg)
47 9/27/2016
![Page 48: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/48.jpg)
48
الگوطبقهبندیاشیاوافرادبرایشناسایی•یادگیرینظارتشده•
درختتصمیم-شبکهعصبی-بیزین--....
9/27/2016
![Page 49: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/49.jpg)
49
بازاريابيمستقيم
تشخيصاسپم
شناساييوطبقهبنديمشتري
پيشبينيوضعيتآينده
9/27/2016
![Page 50: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/50.jpg)
50
Tid Refund MaritalStatus
TaxableIncome Cheat
1 Yes Single 125K No
2 No Married 100K No
3 No Single 70K No
4 Yes Married 120K No
5 No Divorced 95K Yes
6 No Married 60K No
7 Yes Divorced 220K No
8 No Single 85K Yes
9 No Married 75K No
10 No Single 90K Yes10
Refund
Mar St
Tax Inc
YESNO
NO
NO
Yes No
MarriedSingle, Divorced
< 80K > 80K
Best when the predictor variables are
categorical
9/27/2016
![Page 51: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/51.jpg)
51
Tid Refund MaritalStatus
TaxableIncome Cheat
1 Yes Single 125K No
2 No Married 100K No
3 No Single 70K No
4 Yes Married 120K No
5 No Divorced 95K Yes
6 No Married 60K No
7 Yes Divorced 220K No
8 No Single 85K Yes
9 No Married 75K No
10 No Single 90K Yes10
Training
SetModel
Learn Classifier
Refund MaritalStatus
TaxableIncome Cheat
No Single 75K ?
Yes Married 50K ?
No Married 150K ?
Yes Divorced 90K ?
No Single 40K ?
No Married 80K ?10
Test
Set
9/27/2016
![Page 52: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/52.jpg)
Support Vectors
Small Margin Large Margin
52
![Page 53: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/53.jpg)
53
هکشفتغييراتدردادههابراساسرفتارنرمالگذشت(تفاوتاصليباروشهايدستهبندي)کشفحمالتجديد:
کهتندهسنفوذياتقلبمواردکشفبهقادرروشهادستهايناستندادهرخآنهامشابهقبالً
مواردونهاينگتشخيصبهقادردستهبنديروشهايحاليکهدر.نيستند(نداردوجودآنهاباارتباطدرآموزشيموردکه)
مثالکاربردتشخيصحملهيانفوذدرشبکهاريکشفالگوهايخريدغيرنرمالتوسطکارتهاياعتب
9/27/2016
![Page 54: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/54.jpg)
9/27/201654
![Page 55: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/55.jpg)
55
![Page 56: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/56.jpg)
56 9/27/2016
0.0%
5.0%
10.0%
15.0%
20.0%
25.0%
30.0%
35.0%
40.0%
45.0%
50.0%
2011
2013
2014
www.kdnuggets.com/
![Page 57: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/57.jpg)
57 9/27/2016
![Page 58: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/58.jpg)
58 9/27/2016
![Page 59: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/59.jpg)
59 9/27/2016
![Page 60: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/60.jpg)
60 9/27/2016
![Page 61: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/61.jpg)
61 9/27/2016
![Page 62: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/62.jpg)
62 9/27/2016
![Page 63: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/63.jpg)
63 9/27/2016
![Page 64: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/64.jpg)
64 9/27/2016
![Page 65: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/65.jpg)
65 9/27/2016
![Page 66: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/66.jpg)
66
![Page 67: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/67.jpg)
ب مناسبخش از داده های انتخاب و استخراج داده ها : نمونه گیری مناسب(کسب و کار)داده های سازمان برای انجام داده کاوی از میان انبوه
از برای یافتن روابط احتمالی یا انحراف: تحلیل اکتشافی داده هاتحقیقایده های و رسیدن به اهداف و داده ها در غیرمعمول معیارهای
راهم و تبدیل متغیرها برای ف، انتخاب به واسطه الحاق: داده ها تعدیلمدل هاساخت شرایط ساختن
دن به هدف شناسایی روابط بین متغیرها که پیش بینی و رسی: مدل سازی.مطلوب ما را تسهیل می نماید
ام با استفاده از داده های واقعی کیفیت مدل برای انج: مدل ها ارزیابی.داده کاوی ارزیابی می شود
9/27/201667
![Page 68: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/68.jpg)
درک مساله(Business understanding)
فهم داده(Data understanding)
آماده سازی داده(Data preparation)
مدل سازی(Modeling)
ارزیابی(Evaluation)
توسعه(Deployment)
9/27/201668
![Page 69: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/69.jpg)
9/27/201669
تجارتدرك ها هدرك داد
پيش پردازش
مدل سازي
ارزيابي
بکارگيري
دادهها
![Page 70: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/70.jpg)
9/27/201670
فرایندCRISP-DM(اصالحیابهبود-تکرار)چرخشیپروسهیکدر.می دهدانجامراکاویدادههدف
استشدهدادهنمایشمختلفمراحلمهموابستگی هایتنهاشکلدر.
داردنیازقبلفازهاینتایجبه(شکلدر)بعدفازکلیبصورت.
بهرگشتببهنیازاستممکن(بعدفازبهرفتنبجای)فازهرانجامازبعد.باشدقبلفازهای
![Page 71: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/71.jpg)
DataUnderstanding
Collect Initial DataInitial Data Collection
Report
Describe DataData Description Report
Explore DataData Exploration Report
Verify Data Quality Data Quality Report
BusinessUnderstanding
Determine Business Objectives
BackgroundBusiness ObjectivesBusiness Success Criteria
Situation AssessmentInventory of ResourcesRequirements,Assumptions, andConstraintsRisks and ContingenciesTerminologyCosts and Benefits
Determine Determine Data Mining
GoalData Mining GoalsData Mining Success
Criteria
Produce Project PlanProject PlanInitial Asessment of Tools and
Techniques
9/27/201671
![Page 72: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/72.jpg)
9/27/201672
Data Preparation
Data SetData Set Description
Select Data Rationale for Inclusion /
Exclusion
Clean Data Data Cleaning Report
Construct DataDerived AttributesGenerated Records
Integrate DataMerged Data
Format DataReformatted Data
Modeling
Select ModelingTechnique
Modeling TechniqueModeling Assumptions
Generate Test DesignTest Design
Build ModelParameter SettingsModelsModel Description
Assess ModelModel AssessmentRevised Parameter Settings
![Page 73: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/73.jpg)
Evaluation
Evaluate ResultsAssessment of Data
Mining Results w.r.t. Business Success Criteria
Approved Models
Review ProcessReview of Process
Determine Next StepsList of Possible ActionsDecision
Plan DeploymentDeployment Plan
Plan Monitoring and Maintenance
Monitoring and Maintenance Plan
Produce Final ReportFinal ReportFinal Presentation
Review ProjectExperience
Documentation
Deployment
9/27/201673
![Page 74: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/74.jpg)
شناسایی و آشنایی با دامنه کاربرد یا کسب . های انتخاب حوزه)و کار 1(مهم سازمان
تشخیص اهداف بکارگیری یا کاربردهای مفید داده کاوی در سازمان. 2مورد نظر( کسب و کار)
شناسایی منابع داده و ویژگی ها . به مربوط( فیلدها، متغیرها یا عوامل)3هدف
نمونه برداری . از میان داده های سازمان( بازه زمانی محدود)حجم محدود داده 4
پیش پردازش و آماده سازی داده ها . ها، پاک سازی و تبدیل و کدینگ داده)5...(انتخاب ویژگی های مهم و تاثیرگذار بر هدف و
انتخاب بهترین روش از میان الگوریتم های مختلف موجود . عه یا توس)6و تنظیم ( یک الگوریتم جدید مختص به داده ها و کاربرد فعلی
پارامترهای روش انتخاب شده
![Page 75: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/75.jpg)
انجام فرایند اصلی داده کاوی و ساخت مدل یا استخراج الگوهای . 7
مخفی میان داده ها
ارزیابی خودکار توسط معیارهای مشخص شده برای روش های . 8
بهبرگشت)دانش کشف شده /داده کاوی برای تعیین کیفیت مدل(بستهبهکیفیتنتایج6یا5مرحله
اجرای فرایند بر روی داده های واقعی و پس پردازش نتایج . ر تفسی)9(نتایج و شناسایی و انتخاب الگوها یا دانش مفید و با ارزش
استفاده از الگو. یا ( دنیای واقعی)دانش بدست آمده در کسب و کار /01(تبدیل دانش به حکمت)مدیران تصمیم گیری
![Page 76: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/76.jpg)
76 9/27/2016
![Page 77: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/77.jpg)
آشناييباروشها،تکنيکهاوابزارهايدادهکاوي
آشناييکليبامفاهيمفرايندکاوي،انبارهدادهوداشبوردهايمديريتي
تکنيکهايبدونناظر،باناظرونيمهناظر
آماده،ابزارهايپردازشدادههايعظيموبرنامهنويسيدادهکاويابزارهاي
پيشپردازشدادهوتحليلالگ
آشناييباکسبوکارسازمان
فرايندوگردشکار؛گردشدادههامصاحبهبامديرانبرايشناساييچالشهاومشکالتسطحکالنسيستممصاحبهباکارشناسانبرايشناساييچالشهاومشکالتعملياتيسيستمشناختمشکالتوراههايتقلبدرسيستمموجودفعليدرسيستم(ناموجود)آشناييباگزارشاتموجودوگزارشاتموردنياز
9/27/201677
![Page 78: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/78.jpg)
آشناييباکاربردهايدادهکاويدرحوزههايمشابه
بيمه،،معموالًاهدافوکاربردهايدادهکاويدرمحيطهايآموزشي،بانکداري
.تکراريهستند...توليديوشرکتهايفروشگاهها،
ادهکاويباروشهاوتکنيکهايد(باتوجهبهشناختکسبوکار)نگاشتنيازهايسازمان
هرحوزهايکهنيازبهشناساييالگوهايجديدوارتباطبيندادههادارد.
دادههااحساسشود(خالصهسازيوتوصيف)نيازبهگروهبندي.
نيازبهپيشبينيپديدههاومشخصکردننيازهايآتي
نيازبهتحليلوبررسينتايجحاصلازانجاميارخداديکپديده
پديدهتحليلعلتوويژگيهايموثردررخداديک
9/27/201678
![Page 79: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/79.jpg)
79
معیارهایانتخابحوزه
فاکتورهایتعیینکنندههرمعیار
یدسترسیپذیر با سیستم ( آشنا)موجود بودن شخص خبره(business expert) (درون سازمان)دسترسی به داده ها (از نظر حراست و حریم خصوصی)دسترسی از نظر سطح امنیت داده
اهمیتحوزه
(درجه اهمیت ذینفعان)مدیران میزان استفاده توسط (تعداد ذیفعان یا خدمات بهتر)کاربران میزان استفاده توسط ارباب رجوع و اغلب فرایندهای هدف)میزان درآمدزایی یا هزینه بردار بودنDM کم کردن
(هزینه ها یا افزایش درآمدزایی سازمان است در سیستم( تحلیل های مورد نیاز)تعداد چالش های موجود بعدیمفید بودن نتایج احتمالی داده کاوی برای سازمان و تصمیم گیری های
(گزارشات تحلیلی مورد نیاز مدیران از دیدگاه اهمیت استراتژیک)
کیفیتداده
(تعداد جدول، رکورد و فیلد)حجم داده (استفاده از داده های سالهای گذشته برای تحلیل رفتار)داده داده سابقه (داده های کمّی و پر شدن خودکار فیلدها)واقعی و دقیق بودن تمیز بودن داده ها( بودن خطای داده یا کمnoise و داده خالی یاmissing)
![Page 80: Data Mining (Concepts, Applications, Techniques, Tools, Process, Experiences) - داده کاوی (مفاهیم، کاربردها، تکنیک ها، ابزارها، فرایند](https://reader031.vdocuments.net/reader031/viewer/2022020411/58716cc31a28ab58758b6a37/html5/thumbnails/80.jpg)
80 9/27/2016