Ako začať s projektom big data

Pri big data treba robiť chyby rýchlo Ako v korporácii začať s big data

Keď sa v organizácii začína s business intelligence, často sa zdôrazňuje zásada “think big, start small”. Znamená to, že je potrebné začať malým uceleným projektom, ktorý už od počiatku treba plánovať tak, aby mohol byť súčasťou celkopodnikového riešenia.

Pri projektoch s big data je však potrebný iný prístup. Tu platí princíp, čo sa dá vyjadriť vetou: “Fail fast, to succeed ultimately.” Voľne preložené: “Robte chyby rýchle, aby ste to nakoniec zvládli.”

Continue reading Pri big data treba robiť chyby rýchlo Ako v korporácii začať s big data

Zdieľať na Sieti:

Hadoop alebo NoSQL? Čo sú to NoSQL databázy a ako fungujú

Ak sa Hadoop často považuje synonymum pre big data, NoSQL sa mnohokrát používa ako ozanačenie pre Hadoop. V skutočnosti rozdiel medzi týmito tromi pojmami je podobný ako rozdiel medzi slovami slivky, kôstkoviny a ovocinárstvo. Continue reading Hadoop alebo NoSQL? Čo sú to NoSQL databázy a ako fungujú

Zdieľať na Sieti:
MapReduce zaklínadlo pre big data

MapReduce hlavné zaklídandlo pre big data - ako to funguje

MapReduce je pre big data tým, čím je optický kábel pre dátovú komunikáciu. Je to najuniverzálnejší sposob masívneho paraleného spracovania veľkých objemov dát. Túto metódu vytvoril Google a implementoval ju do vlastnej technológie. Google si však toto know how neponechal pre seba, ale publikoval ho verejne prostredníctvom vedeckého článku. Následne viacero spoločnosti a open sourceových komunít na týchto princípoch vyvinuli vlastné systémy. Najznámejším je  Apache Hadoop. Je tu však aj mnoho iných, ako MongoDEB, Couchdb, Riak a ďalšie.

Continue reading MapReduce hlavné zaklídandlo pre big data – ako to funguje

Zdieľať na Sieti:
ako funguje data mining

Ako funguje data mining metódy hĺbkovej analýzy dát

V predošlom článku sme vysvetlili základné princípy data miningu a naznačili hlavné oblasti jeho aplikácie. Data mining (doslova “dolovanie dát” ale správnejšie označenie je “hĺbková analýza dát”) je teda súbor rôznych metód a postupov na automatizované zisťovanie zaujímavých informácií z veľkého množstva dát. Tieto metódy sa dajú roztriediť do do niekoľkých skupín.

Continue reading Ako funguje data mining metódy hĺbkovej analýzy dát

Zdieľať na Sieti:
data mining - hĺbková analýza dát

Data mining ako sa učia počítače

Pojmom data minig sa označujú techniky postupy, ktoré umožňujú strojom (počítačom) “naučiť” sa určité veci. “Naučiť sa” je možno trochu silné slovo a v tomto prípade neznamená  učenie v zmysle, ako ho používame u ľudí. Naučenie znamená, že počítač je schopný samostatne riešiť určité skupiny úloh bez toho, že by im nejaký programátor presne určil pravidlá vyhodnocovania údajov. Continue reading Data mining ako sa učia počítače

Zdieľať na Sieti: