data mining - hĺbková analýza dát

Data mining ako sa učia počítače

Pojmom data minig sa označujú techniky postupy, ktoré umožňujú strojom (počítačom) “naučiť” sa určité veci. “Naučiť sa” je možno trochu silné slovo a v tomto prípade neznamená  učenie v zmysle, ako ho používame u ľudí. Naučenie znamená, že počítač je schopný samostatne riešiť určité skupiny úloh bez toho, že by im nejaký programátor presne určil pravidlá vyhodnocovania údajov.

Typickým príkladom sú spamové filtre pre e-maily. Tu tiež nie je možné priamo naprogramovať presné pravidlá, podľa ktorých má počítač rozhodnúť či nejaký e-mail presunúť do spamového koša pre otravné reklamy, alebo ho posunúť užívateľovi na prečítanie. Jednoznačné pravidlá sa nedajú naprogramovať hlavne z dvoch dôvodov: Po prvé sú príliš komplexné a po druhé spameri vymýšľajú stále nové spôsoby, ako oklamať tieto filtre a prepašovať svoje reklamné e-maily k očiam užívateľov.

Namiesto priameho naprogramovania pravidiel teda softvéroví inžinieri vytvorili algoritmy, ktoré z e-mailov dokážu vytiahnuť rôzne parametre: kto ho poslal, koľkým prijemcom išiel tento e-mail, zonam slov a ich frekvencia v predmete e-mailu aj samotnej správe a mnohé ďalšie. Potom danému počítaču dali prečítať množstvo e-mailov a povedali mu, ktoré sú spam a ktoré nie. Počítač si na základe toho vytvoril vlastnú databázu charakteristických znakov podľa ktorých rozhodne, či daný e-mail je spam, alebo nie.

data mining

Tento proces sa nazýva učením preto, že počítač si na základe vstupných údajov (e-mailov) vytvorí vlastné rozhodovacie mechanizmy. Program zostáva stále ten istý, ale to, ako sa bude v konečnom dôsledku rozhodovať (či označiť e-amil ako spam alebo nie) závisí od dát, ktoré na učenie dostane.A keď dostane nejaké nové údaje na učenie, môže upraviť svoje rozhodovacie kritériá (naučiť sa nové veci).

Spamové filtre sú samozrejme len jedným z príkladov samoučiacich sa programov. Ďalšie možnosti ich využitia sú najmä v marketingu a reklame ako aj v odhaľovaní podvodov.

Väčšina čitateľov sa zrejme stretla s cielenou reklamou, ktorú Google zobrazuje na svojich stránkach alebo v Gmaili. O tom, či sa reklama zobrazí a aká reklama to bude rohoduje počítač na základe toho, aké slová užívateľ vyhľadáva, alebo čo sa píše v jeho správach. Využíva na to práve techniky data minignu. Podobne to robia aj sociálne siete ako napr Facebook a ďalší.  

Data mining rozsiahle využívajú internetové obchody pri odporúčaní doplnkových produktov k tomu, čo práve zákazník nakupuje alebo si ešte len prezerá. Banky, telekomunikační operátori ale už aj maloobchodníci využívajú data mining na určovanie, ktorým zákazníkom ponúknuť prémiové alebo doplnkové produkty (up-selling, cross-selling), prípadne u ktorých zákazíkov hrozí odchod a je potrebné dať im špeciálnu ponuku, aby si ich udržali. Jeden príklad je napríklad tu: http://smartketing.sk/5-sposobov-ako-zvysit-predaj-a-usetrit-na-marketingu/

Veľmi bohaté využitie má data mining aj pri odhaľovaní podvodných transakcii napríklad v elektronickom bankovníctve, zneužívaní platobných kariet, krádeží identity na sociálnych sieťach, neoprávneného prístupu do informačných systémov a podobne.

Samozrejme, možnosti aplikácie data miningu je oveľa viac, vyššie uvedené sú len tie najčastejšie používané. V každom prípade, s postupným nárastom digitalizácie podnikových proesov, rozvojom systémov na spracovanie veľkých objemov dát a neustále klesajúcou cenou hardvéru sa dá celkom spoľahlivo predpokladať, že data minig sa bude, zvlášť v komerčnej sfére využívať stále viac.

Zdieľať na Sieti: