Pokročilé analýzy dat a textů / Data mining, text/web mining
Transkript
Pokročilé analýzy dat a textů / Data mining, text/web mining Data mining i text mining jsou postupy využívané tam, kde jsou k dispozici velké objemy dat a textů, které je potřeba „vytěžit“ a přetavit na určitou znalost či obchodní výhodu. Jako příklad uveďme oblast marketingu a prodeje, kde pokročilé analýzy strukturovaných dat (data mining) i nestrukturovaných textů (text/web mining) poskytují obchodní výhodu nalezením odpovědí na otázky jako: » » » Jak nejlépe cíleně oslovit zákazníky – s jakou nabídkou, jak často, jakým kanálem? U kterých zákazníků lze nalézt potenciální fraud chování? V jakých souvislostech (kontextech) lze na internetu nalézt jméno společnosti zákazníka? Pokročilé analýzy se uplatňují tam, kde není možný nebo efektivní individualizovaný manuální přístup a kde současně není vhodné nebo možné jednotné plošné řešení. Úkolem je efektivně využít zdroje, které jsou k dispozici, a změnit potenciálně zajímavé informace na výstupy s reálnou hodnotou. Jak postupujeme 1. Stanovení obchodního cíle Na začátku určíme společně se zákazníkem obchodní cíle, například lepší zacílení nabídek, minimalizace rizika, prevence odchodů, úspory v interních procesech pomocí automatické kategorizace příchozích dokumentů atd. 3. Implementace řešení do stávající procesní a technické infrastruktury Nalezené řešení prezentujeme konzultačním způsobem tak, aby bylo srozumitelné koncovým uživatelům bez znalostí analytických technologií. Součástí řešení často bývá jeho implementace do stávajících obchodních procesů a technologické infrastruktury, např. automatizované poskytnutí varování určitého druhu kontaktním pracovníkům, zadání pro marketingovou kampaň, určitý report v rámci manažerského informačního systému apod. Příklady využití data a text miningu Níže uvádíme příklady řešení, které realizovala společnost KOMIX s.r.o. nebo členové týmu naší společnosti. 2. Shromáždění dat a analytické řešení Po stanovení obchodních cílů realizujeme napojení na relevantní vstupní data a jejich analýzu. Součástí řešení může být interní analytické úložiště pro strukturovaná nebo nestrukturovaná data. Při analytickém řešení využíváme technologie předních komerčních dodavatelů (IBM SPSS, SAS, HP Autonomy aj.), včetně technologií „Big data“, nebo využíváme technologie open source. 1 Stanovení obchodního cíle 2 Shromáždění a příprava dat Data mining – využití strukturovaných údajů » Podpora cíleného prodeje (realizace – bankovní instituce) Při cílených nabídkách prostřednictvím call centra, e-mailu, poštovních zásilek atd. se prostřednictvím modelů tzv. „propensity to buy“ optimalizují náklady tak, že se k oslovení vybírají zákazníci se statisticky vyšší pravděpodobností kladné reakce na nabídku, optimalizuje se i volba kanálu. 3 Analytické řešení 4 Obchodní implementace » » » » » » Prevence odchodu zákazníků (realizace – bankovní instituce) Cílem je zmenšit pravděpodobnost odchodu zákazníků tak, že na určité zákazníky vykazující statisticky vyšší pravděpodobnost odchodu se uplatní retenční strategie. Segmentace zákazníků (realizace – bankovní instituce, mobilní operátor, Národní technická knihovna) Obchodním cílem je rozčlenění zákazníků do určitého počtu hlavních skupin (obvykle 5–15) podle hodnoty, rizikovosti, druhu chování atd. Využívají se pokročilé techniky tzv. clusteringu (shlukování) v kombinaci s expertními obchodními náhledy. Hledání podvodného chování (realizace – zdravotní pojišťovna) Cílem je nalezení podvodného chování a jeho prevence. V případě velkého množství případů (vykázaná zdravotní péče) je tak možné radikálně minimalizovat náklady na kontrolu tak, že jsou označeny případy, které vykazují statisticky nápadně odlišné chování od chování typického. Analýza nákupního košíku pro účely optimalizace nákupní plochy (realizace – retail) Cílem je optimalizace umístění zboží na nákupní ploše (např. jedno zboží je umístěno na více místech) pro účely zvýšení prodeje na základě asociačního efektu kupujících. Začlenění výsledků data mining do procesu cíleného marketingu (realizace – bankovní instituce) Cílem je obchodně-procesní i technologická integrace. Příkladem je situace, kdy při volání klienta na call centrum má klientský pracovník na úvodní obrazovce informace o tom, které produkty je možné se zvýšenou pravděpodobností úspěchu volajícímu v případě vhodně vyvíjejícího se telefonního hovoru nabídnout. Odhad budoucí návštěvnosti s využitím časových řad (realizace – Národní technická knihovna) Na základě historických údajů se odhaduje budoucí vývoj návštěvnosti instituce. Součástí analýzy je analýza sezónních výkyvů ev. externích jevů typu propagační kampaň. Oblast text mining – využití nestrukturovaných údajů (texty, hlasové informace) » Segmentace odpovědí ze zaměstnaneckých nebo zákaznických průzkumů (realizace – bankovní instituce) Obchodním cílem je určení typologií textových odpovědí a jejich rozdělení do menšího počtu (cca 8–10) skupin pro porozumění typologií zaměstnaneckých nebo zákaznických požadavků. Realizuje se s využitím shlukovacích algoritmů text miningu. » Automatizovaná kategorizace příchozích stížností nebo požadavků (realizace – bankovní instituce) Automatická kategorizace příchozích stížností nebo požadavků umožňuje v případě statisticky „jistého“ výsledku poslat daný požadavek přímo na příslušného řešitele, pouze v případě statisticky nejistého určení se následně provádí kategorizace ručně. » Analýza web informací pro účely minimalizace rizika (realizace – bankovní instituce) Při schvalování firemního úvěru vstupují do schvalovacího procesu výsledky web analýzy, kdy pro název dané firmy je získáno rizikové skóre vypočtené analýzou textových zdrojů získaného z volně přístupných online zdrojů. Spojení oblasti data mining a text mining » Posílení modelů „propensity to buy“ (náchylnost ke koupi) pokročilými textovými analýzami (realizace – bankovní instituce) Modely typu „propensity to buy“ využívané pro snížení nákladů a zlepšení účinnosti cíleného oslovování zákazníků byly posíleny prostřednictvím pokročilých textových analýz. O společnosti KOMIX KOMIX s.r.o. je česká společnost založená v roce 1992. Specializuje se zejména na dodávky informačních systémů nebo aplikací na klíč, dále pak integrační nebo transformační projekty. Společnosti KOMIX také poskytuje konzultační služby zaměřené jak na návrh informačních systémů, tak na jejich kvalitu, testování a provoz. Naším posláním je pomocí ICT technologií zlepšovat lidem život, usnadnit jim práci a firmám poskytovat dlouhodobou konkurenční výhodu. KOMIX s.r.o. Drtinova 467/2A / Praha 5 / 150 00 +420 257 288 211 / [email protected] / www.komix.cz
Podobné dokumenty
Řešení pro podporu rozhodování a cíleného marketingu
Určení typologií textových odpovědí a jejich rozdělení
do menšího počtu skupin pro porozumění typologií
zaměstnaneckých nebo zákaznických požadavků. Realizuje
se s využitím shlukovacích algoritmů t...
Inicializační rozdělení do shluků a jeho vliv na konečné shlukování v
Shluková analýza se stala jedním z hlavních nástrojů pouţívaných při získávání
znalostí z dat, které je označováno jako data mining. V této nové oblasti analýzy
dat se často zpracovávají data velký...
Úvod do problematiky Stále větší množství dat uložených v
◦ Koncový uzel – třída, do které je objekt klasifikován
11 Reseni pro dlouhodobe ukladani dat
Zákonné požadavky na uchování dat
Oborové požadavky na uložení dat
např. z výrobních testů
Nutnost prokazatelnosti původu a
neměnnosti dat
Informační systémy - Katedra automatizační techniky a řízení
{Výpočet kostky (volba úložiště)
{Zpracování výsledků
(výsledky je možno zobrazit např v MS Excel
jako kontingenční tabulku)
Informační systémy 2006/2007
Inovační vouchery Fakulta managementu
datových souborů, výběrových šetření, analýza textových informačních zdrojů.
Sběr a analýza veřejně dostupných dat zejména z oblasti veřejných financí, eventuelně i jiné oblasti dle zájmu
a dle i...
management znalostí - Personalizace výuky prostřednictvím e
spojenou se zvýšením výkonnosti firmy, přežití firmy v reakci na stále dynamičtějším a
nestabilnějším situaci trhu. Prioritním cílem „Knowledge managementu“ je dosažení vyšší
prosperity podniku. Pr...
Prezentace aplikace PowerPoint
• kontakty – Argentina, ČR, Indie, Irsko, Itálie,
Kanada, Qatar, Rumunsko, Rusko, Řecko,
Srbsko, Španělsko, Tunis, UK, USA
• http://ui.pefka.mendelu.cz/en/NLP