Hadoop: The Definitive Guide
Autor Tom Whiteen Limba Engleză Paperback – 5 mai 2015
Prin parcurgerea acestui volum, cititorul va dobândi competențele necesare pentru a construi și menține sisteme distribuite scalabile și fiabile folosind ecosistemul Apache Hadoop. Notăm cu interes că această a patra ediție a Hadoop: The Definitive Guide face tranziția completă către Hadoop 2, punând un accent deosebit pe arhitectura YARN și pe integrarea cu tehnologii moderne de procesare precum Spark sau formatul de date imbricate Parquet. Considerăm că forța acestui manual rezidă în echilibrul dintre rigoarea teoretică a sistemelor de fișiere distribuite (HDFS) și pragmatismul implementării. Tom White ghidează utilizatorul prin procesul complex de configurare a unui cluster, analizând în profunzime fluxurile MapReduce și mecanismele de ingestie a datelor prin Flume pentru streaming sau Sqoop pentru transferuri masive. Complementar volumului Professional Hadoop, care se concentrează pe dezvoltatorii experimentați ce omit noțiunile de bază, lucrarea de față oferă o fundamentare completă, fiind accesibilă și administratorilor de sistem care au nevoie de o referință solidă pentru mentenanță și securitate. Față de Pro Apache Hadoop, care explorează disponibilitatea ridicată și federațiile HDFS, textul lui White extinde analiza către instrumente de nivel înalt precum Pig, Hive și Crunch, oferind o perspectivă de ansamblu asupra întregului ecosistem Big Data. Includerea studiilor de caz din domenii precum genomica demonstrează aplicabilitatea practică a tehnologiei în procesarea unor seturi de date de dimensiuni petabyte, transformând teoria abstractă în soluții de calcul performante.
Preț: 325.13 lei
Preț vechi: 406.42 lei
-20%
Carte disponibilă
Livrare economică 12-26 mai
Livrare express 28 aprilie-02 mai pentru 71.75 lei
Specificații
ISBN-10: 1491901632
Pagini: 754
Ilustrații: black & white illustrations
Dimensiuni: 177 x 236 x 45 mm
Greutate: 1.29 kg
Ediția:4th edition
Editura: O'Reilly
De ce să citești această carte
Recomandăm această resursă programatorilor și arhitecților de date care doresc să stăpânească ecosistemul Hadoop 2. Cititorul câștigă o înțelegere profundă a stivei tehnologice Apache, de la stocarea în HDFS până la interogarea complexă cu Hive și Spark. Este un ghid esențial pentru oricine vrea să implementeze soluții de analiză a datelor la scară industrială, oferind soluții concrete pentru probleme de scalabilitate.