Spark: The Definitive Guide
Autor Bill Chambers, Matei Zaharuen Limba Engleză Paperback – 8 mar 2018
Ceea ce diferențiază Spark: The Definitive Guide de documentația oficială sau de alte manuale tehnice este autoritatea directă a perspectivei: Matei Zaharia, creatorul framework-ului, oferă aici arhitectura logică din spatele deciziilor de proiectare. Considerăm că volumul nu se limitează la a fi un simplu catalog de comenzi, ci explică mecanismele interne ale motorului de execuție, oferind o claritate pe care utilizatorii o găsesc rar în resursele online fragmentate. Subliniem importanța tranziției către Spark 2.0, autorii punând un accent deosebit pe API-urile structurate. Textul ghidează cititorul prin concepte complexe precum optimizarea interogărilor în Spark SQL și utilizarea eficientă a seturilor de date (Datasets). Complementar lui Spark de Ilya Ganelin, care se concentrează pe utilizarea în producție și studii de caz, acest volum acoperă fundamentul teoretic și tehnic necesar pentru a înțelege de ce anumite configurații funcționează mai bine decât altele. În timp ce alte resurse pot fi axate strict pe un limbaj, precum Learning PySpark, lucrarea de față explorează ecosistemul Spark în ansamblu, inclusiv interacțiunea cu bibliotecile de machine learning (MLlib) și procesarea în timp real prin Structured Streaming. Experiența de lectură este una densă, orientată spre practică, unde fiecare capitol despre monitorizare sau depanare (debugging) este susținut de exemple de cod și explicații despre modul în care Spark gestionează resursele într-un cluster. Este o resursă tehnică riguroasă, esențială pentru inginerii de date care au nevoie de o referință completă asupra modului în care datele sunt procesate, stocate și analizate la scară mare.
Preț: 351.85 lei
Preț vechi: 439.80 lei
-20%
Carte disponibilă
Livrare economică 14-28 mai
Livrare express 29 aprilie-05 mai pentru 56.95 lei
Specificații
ISBN-10: 1491912219
Pagini: 476
Dimensiuni: 177 x 231 x 39 mm
Greutate: 1.05 kg
Ediția:1
Editura: O'Reilly
De ce să citești această carte
Recomandăm această carte inginerilor de date și administratorilor de sistem care doresc să stăpânească ecosistemul Spark direct de la sursă. Cititorul câștigă o înțelegere profundă a optimizării performanței clusterelor și a implementării modelelor de învățare automată scalabile. Este resursa definitivă pentru a trece de la simple scripturi la aplicații complexe, robuste, capabile să gestioneze fluxuri masive de date în timp real.