Tag Archives: veľké dáta

Ako začať s projektom big data

Pri big data treba robiť chyby rýchlo Ako v korporácii začať s big data

Keď sa v organizácii začína s business intelligence, často sa zdôrazňuje zásada “think big, start small”. Znamená to, že je potrebné začať malým uceleným projektom, ktorý už od počiatku treba plánovať tak, aby mohol byť súčasťou celkopodnikového riešenia.

Pri projektoch s big data je však potrebný iný prístup. Tu platí princíp, čo sa dá vyjadriť vetou: “Fail fast, to succeed ultimately.” Voľne preložené: “Robte chyby rýchle, aby ste to nakoniec zvládli.”

Continue reading Pri big data treba robiť chyby rýchlo Ako v korporácii začať s big data

Zdieľať na Sieti:

Hadoop alebo NoSQL? Čo sú to NoSQL databázy a ako fungujú

Ak sa Hadoop často považuje synonymum pre big data, NoSQL sa mnohokrát používa ako ozanačenie pre Hadoop. V skutočnosti rozdiel medzi týmito tromi pojmami je podobný ako rozdiel medzi slovami slivky, kôstkoviny a ovocinárstvo. Continue reading Hadoop alebo NoSQL? Čo sú to NoSQL databázy a ako fungujú

Zdieľať na Sieti:
MapReduce zaklínadlo pre big data

MapReduce hlavné zaklídandlo pre big data - ako to funguje

MapReduce je pre big data tým, čím je optický kábel pre dátovú komunikáciu. Je to najuniverzálnejší sposob masívneho paraleného spracovania veľkých objemov dát. Túto metódu vytvoril Google a implementoval ju do vlastnej technológie. Google si však toto know how neponechal pre seba, ale publikoval ho verejne prostredníctvom vedeckého článku. Následne viacero spoločnosti a open sourceových komunít na týchto princípoch vyvinuli vlastné systémy. Najznámejším je  Apache Hadoop. Je tu však aj mnoho iných, ako MongoDEB, Couchdb, Riak a ďalšie.

Continue reading MapReduce hlavné zaklídandlo pre big data – ako to funguje

Zdieľať na Sieti: