strojove uceni v marketingu
DESCRIPTION
Lehky uvod do pouziti metod strojoveho uceni v marketingu.TRANSCRIPT
Strojové Učení v MarketinguDavid Filip
Obsah Prezentace
Přiblížení pojmu strojového učeníOblasti použitíPříklady:
analýza registracíoptimalizace landing pagehledání skupin zákazníků
Implementace metod strojového učeníTypické problémy
Strojové UčeníMetodologie pro získávání skrytých informací z dat Mezní obor mezi umělou inteligencí a statistikou
KlasifikaceSeskupováníVyhledáváníDoporučováníHledání vzorů chování
A další, pro nás teď nezajímavé oblasti
Typické Použití
Cílený marketingCross sellingOdchod zákazníkůFraud detectionCredit riskSpam filteringRecommendation enginesFarmacie
a další
Příklady
Analýza Registrací (1/3)
Provozujeme aplikaci a máme zájem zjistit, které faktory ovlivňují registrace
Referrer Lokalita Četl FAQ Page Views Registrace
Google USA Ne 18 None
Seznam CR Ano 25 FreeGoogle India Ne 2 None
(Direct) USA Ne 14 Free
Google USA Ano 25 Premium
...
Zjištěné údaje (analytics, logy apod).
Rozhodovací Stromy
V praxi nejpoužívanější metodaJednoduchá na interpretaci
Jako vstupní data možno použít:číselné údajelogické hodnotytextové popisky kategorií
Funguje i s chybějící informací
Analýza Registrací (2/3)
Analýza Registrací (3/3)
Problémy:Výsledek je příliš vázán na dataStrom může být příliš rozsáhlý
Řešením je prořezání stromu: odstranění částí, které podstatně neovlivňují výsledek. Prořezávání se dle potřeby děje automaticky či manuálně.
Optimalizace Landing Page
Využití předchozího přístupu "on the fly":
1. Vygenerujeme a prořežeme strom2. Zaznamenáme chování uživatele3. ????*4. Profit
* = dle klasifikace nabízíme speciální nabídku
Clustering (1/2)
Hledání skupin podobných objektů v datech.
Objektem může být:Výsledky průzkumů a anketInformace o chování zákazníkůSeznam kupovaných výrobků
Problém velkých datasetů
Clustering (2/2)
Omezeně můžeme využít obyčejné SQL
Pro hledání složitějších závislostí existují lepší postupy:
hierarchické členění k-means clustering: pro hledání k skupindensity based clustering
Implementační detaily
Implementace postupů
Používání standardních algoritmůPrakticky nulová invence implementátoraKnihovny pro ML pro téměř každý jazykSamostatné nástroje:
Free: Weka, R, Orange, ...Placené: SPSS, SAS, Matlab, ...
Typické problémy
Velké nebezpečí u lidí, kteří tomu rozumí "tak trochem". Validnost modelu:
jsou výsledky správné?"bias" problémblack-box metody
Problémy s intuicí:
část problémů je navíc neintuitivních
Úvod pro programátory
Česky: Dobývání znalostí z databází
Dotazy?