Archívy značky: Hadoop

Hadoop alebo NoSQL? Čo sú to NoSQL databázy a ako fungujú

Ak sa Hadoop často považuje synonymum pre big data, NoSQL sa mnohokrát používa ako ozanačenie pre Hadoop. V skutočnosti rozdiel medzi týmito tromi pojmami je podobný ako rozdiel medzi slovami slivky, kôstkoviny a ovocinárstvo. Pokračovať na Hadoop alebo NoSQL? Čo sú to NoSQL databázy a ako fungujú

Zdieľať na Sieti:
MapReduce zaklínadlo pre big data

MapReduce hlavné zaklídandlo pre big data - ako to funguje

MapReduce je pre big data tým, čím je optický kábel pre dátovú komunikáciu. Je to najuniverzálnejší sposob masívneho paraleného spracovania veľkých objemov dát. Túto metódu vytvoril Google a implementoval ju do vlastnej technológie. Google si však toto know how neponechal pre seba, ale publikoval ho verejne prostredníctvom vedeckého článku. Následne viacero spoločnosti a open sourceových komunít na týchto princípoch vyvinuli vlastné systémy. Najznámejším je  Apache Hadoop. Je tu však aj mnoho iných, ako MongoDEB, Couchdb, Riak a ďalšie.

Pokračovať na MapReduce hlavné zaklídandlo pre big data – ako to funguje

Zdieľať na Sieti: