Cantitate/Preț
Produs

Spark: The Definitive Guide

Autor Bill Chambers, Matei Zaharu
en Limba Engleză Paperback – 8 mar 2018

Ceea ce diferențiază Spark: The Definitive Guide de documentația oficială sau de alte manuale tehnice este autoritatea directă a perspectivei: Matei Zaharia, creatorul framework-ului, oferă aici arhitectura logică din spatele deciziilor de proiectare. Considerăm că volumul nu se limitează la a fi un simplu catalog de comenzi, ci explică mecanismele interne ale motorului de execuție, oferind o claritate pe care utilizatorii o găsesc rar în resursele online fragmentate. Subliniem importanța tranziției către Spark 2.0, autorii punând un accent deosebit pe API-urile structurate. Textul ghidează cititorul prin concepte complexe precum optimizarea interogărilor în Spark SQL și utilizarea eficientă a seturilor de date (Datasets). Complementar lui Spark de Ilya Ganelin, care se concentrează pe utilizarea în producție și studii de caz, acest volum acoperă fundamentul teoretic și tehnic necesar pentru a înțelege de ce anumite configurații funcționează mai bine decât altele. În timp ce alte resurse pot fi axate strict pe un limbaj, precum Learning PySpark, lucrarea de față explorează ecosistemul Spark în ansamblu, inclusiv interacțiunea cu bibliotecile de machine learning (MLlib) și procesarea în timp real prin Structured Streaming. Experiența de lectură este una densă, orientată spre practică, unde fiecare capitol despre monitorizare sau depanare (debugging) este susținut de exemple de cod și explicații despre modul în care Spark gestionează resursele într-un cluster. Este o resursă tehnică riguroasă, esențială pentru inginerii de date care au nevoie de o referință completă asupra modului în care datele sunt procesate, stocate și analizate la scară mare.

Citește tot Restrânge

Preț: 35185 lei

Preț vechi: 43980 lei
-20%

Puncte Express: 528

Carte disponibilă

Livrare economică 14-28 mai
Livrare express 29 aprilie-05 mai pentru 5695 lei


Specificații

ISBN-13: 9781491912218
ISBN-10: 1491912219
Pagini: 476
Dimensiuni: 177 x 231 x 39 mm
Greutate: 1.05 kg
Ediția:1
Editura: O'Reilly

De ce să citești această carte

Recomandăm această carte inginerilor de date și administratorilor de sistem care doresc să stăpânească ecosistemul Spark direct de la sursă. Cititorul câștigă o înțelegere profundă a optimizării performanței clusterelor și a implementării modelelor de învățare automată scalabile. Este resursa definitivă pentru a trece de la simple scripturi la aplicații complexe, robuste, capabile să gestioneze fluxuri masive de date în timp real.


Descriere

Learn how to use, deploy, and maintain Apache Spark with this comprehensive guide, written by the creators of the open-source cluster-computing framework. With an emphasis on improvements and new features in Spark 2.0, authors Bill Chambers and Matei Zaharia break down Spark topics into distinct sections, each with unique goals.You'll explore the basic operations and common functions of Spark's structured APIs, as well as Structured Streaming, a new high-level API for building end-to-end streaming applications. Developers and system administrators will learn the fundamentals of monitoring, tuning, and debugging Spark, and explore machine learning techniques and scenarios for employing MLlib, Spark's scalable machine-learning library.Get a gentle overview of big data and SparkLearn about DataFrames, SQL, and Datasets--Spark's core APIs--through worked examplesDive into Spark's low-level APIs, RDDs, and execution of SQL and DataFramesUnderstand how Spark runs on a clusterDebug, monitor, and tune Spark clusters and applicationsLearn the power of Structured Streaming, Spark's stream-processing engineLearn how you can apply MLlib to a variety of problems, including classification or recommendation