Ak sa Hadoop často považuje synonymum pre big data, NoSQL sa mnohokrát používa ako ozanačenie pre Hadoop. V skutočnosti rozdiel medzi týmito tromi pojmami je podobný ako rozdiel medzi slovami slivky, kôstkoviny a ovocinárstvo. Continue reading Hadoop alebo NoSQL? Čo sú to NoSQL databázy a ako fungujú
Monthly Archives: October 2015
MapReduce hlavné zaklídandlo pre big data - ako to funguje
MapReduce je pre big data tým, čím je optický kábel pre dátovú komunikáciu. Je to najuniverzálnejší sposob masívneho paraleného spracovania veľkých objemov dát. Túto metódu vytvoril Google a implementoval ju do vlastnej technológie. Google si však toto know how neponechal pre seba, ale publikoval ho verejne prostredníctvom vedeckého článku. Následne viacero spoločnosti a open sourceových komunít na týchto princípoch vyvinuli vlastné systémy. Najznámejším je Apache Hadoop. Je tu však aj mnoho iných, ako MongoDEB, Couchdb, Riak a ďalšie.
Continue reading MapReduce hlavné zaklídandlo pre big data – ako to funguje
Ako funguje data mining metódy hĺbkovej analýzy dát
V predošlom článku sme vysvetlili základné princípy data miningu a naznačili hlavné oblasti jeho aplikácie. Data mining (doslova “dolovanie dát” ale správnejšie označenie je “hĺbková analýza dát”) je teda súbor rôznych metód a postupov na automatizované zisťovanie zaujímavých informácií z veľkého množstva dát. Tieto metódy sa dajú roztriediť do do niekoľkých skupín.
Continue reading Ako funguje data mining metódy hĺbkovej analýzy dát