Cantitate/Preț
Produs

Hadoop: The Definitive Guide

Autor Tom White
en Limba Engleză Paperback – 5 mai 2015

Prin parcurgerea acestui volum, cititorul va dobândi competențele necesare pentru a construi și menține sisteme distribuite scalabile și fiabile folosind ecosistemul Apache Hadoop. Notăm cu interes că această a patra ediție a Hadoop: The Definitive Guide face tranziția completă către Hadoop 2, punând un accent deosebit pe arhitectura YARN și pe integrarea cu tehnologii moderne de procesare precum Spark sau formatul de date imbricate Parquet. Considerăm că forța acestui manual rezidă în echilibrul dintre rigoarea teoretică a sistemelor de fișiere distribuite (HDFS) și pragmatismul implementării. Tom White ghidează utilizatorul prin procesul complex de configurare a unui cluster, analizând în profunzime fluxurile MapReduce și mecanismele de ingestie a datelor prin Flume pentru streaming sau Sqoop pentru transferuri masive. Complementar volumului Professional Hadoop, care se concentrează pe dezvoltatorii experimentați ce omit noțiunile de bază, lucrarea de față oferă o fundamentare completă, fiind accesibilă și administratorilor de sistem care au nevoie de o referință solidă pentru mentenanță și securitate. Față de Pro Apache Hadoop, care explorează disponibilitatea ridicată și federațiile HDFS, textul lui White extinde analiza către instrumente de nivel înalt precum Pig, Hive și Crunch, oferind o perspectivă de ansamblu asupra întregului ecosistem Big Data. Includerea studiilor de caz din domenii precum genomica demonstrează aplicabilitatea practică a tehnologiei în procesarea unor seturi de date de dimensiuni petabyte, transformând teoria abstractă în soluții de calcul performante.

Citește tot Restrânge

Preț: 32513 lei

Preț vechi: 40642 lei
-20%

Puncte Express: 488

Carte disponibilă

Livrare economică 12-26 mai
Livrare express 28 aprilie-02 mai pentru 7175 lei


Specificații

ISBN-13: 9781491901632
ISBN-10: 1491901632
Pagini: 754
Ilustrații: black & white illustrations
Dimensiuni: 177 x 236 x 45 mm
Greutate: 1.29 kg
Ediția:4th edition
Editura: O'Reilly

De ce să citești această carte

Recomandăm această resursă programatorilor și arhitecților de date care doresc să stăpânească ecosistemul Hadoop 2. Cititorul câștigă o înțelegere profundă a stivei tehnologice Apache, de la stocarea în HDFS până la interogarea complexă cu Hive și Spark. Este un ghid esențial pentru oricine vrea să implementeze soluții de analiză a datelor la scară industrială, oferind soluții concrete pentru probleme de scalabilitate.


Descriere

Get ready to unlock the power of your data. With the fourth edition of this comprehensive guide, you’ll learn how to build and maintain reliable, scalable, distributed systems with Apache Hadoop. This book is ideal for programmers looking to analyze datasets of any size, and for administrators who want to set up and run Hadoop clusters.Using Hadoop 2 exclusively, author Tom White presents new chapters on YARN and several Hadoop-related projects such as Parquet, Flume, Crunch, and Spark. You’ll learn about recent changes to Hadoop, and explore new case studies on Hadoop’s role in healthcare systems and genomics data processing.Learn fundamental components such as MapReduce, HDFS, and YARNExplore MapReduce in depth, including steps for developing applications with itSet up and maintain a Hadoop cluster running HDFS and MapReduce on YARNLearn two data formats: Avro for data serialization and Parquet for nested dataUse data ingestion tools such as Flume (for streaming data) and Sqoop (for bulk data transfer)Understand how high-level data processing tools like Pig, Hive, Crunch, and Spark work with HadoopLearn the HBase distributed database and the ZooKeeper distributed configuration service