Cantitate/Preț
Produs

Learning Spark

Autor Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee
en Limba Engleză Paperback – aug 2020

ABORDAREA PRACTICĂ: Volumul se concentrează pe aplicabilitatea imediată a platformei Apache Spark 3.0, transformând conceptele teoretice de procesare distribuită în fluxuri de lucru concrete. Remarcăm modul în care autorii, printre care Jules S. Damji și Denny Lee, reușesc să demonstreze necesitatea unificării structurilor de date pentru a eficientiza sarcinile complexe de analiză și învățare automată. În loc să rămână la nivel de specificații tehnice, textul ghidează cititorul prin implementarea algoritmilor de machine learning și a proceselor de analytics pe seturi de date masive. Reținem că această a doua ediție pune un accent deosebit pe motorul optimizat de interogare și pe noile funcționalități din versiunea 3.0, oferind o perspectivă clară asupra modului în care datele eterogene pot fi gestionate la scară largă. Cititorul care a aplicat deja ideile din Beginning Apache Spark 2 de Hien Luu va găsi aici continuarea firească a procesului de învățare, făcând trecerea de la conceptele de bază ale seturilor de date distribuite reziliente (RDDs) la optimizările avansate și structura unificată oferită de versiunile moderne. Merită menționat că, spre deosebire de manualele care tratează Spark ca pe un instrument izolat, Learning Spark de la O'Reilly integrează bunele practici de inginerie a datelor, facilitând înțelegerea modului în care formatul și viteza de sosire a informației influențează deciziile de arhitectură. Tonul tehnic și riguros este susținut de exemple care vizează direct rezolvarea problemelor de scalabilitate cu care se confruntă astăzi departamentele de IT.

Citește tot Restrânge

Preț: 36395 lei

Preț vechi: 45493 lei
-20%

Puncte Express: 546

Carte disponibilă

Livrare economică 29 mai-12 iunie
Livrare express 14-20 mai pentru 7452 lei


Specificații

ISBN-13: 9781492050049
ISBN-10: 1492050040
Pagini: 300
Dimensiuni: 179 x 233 x 23 mm
Greutate: 0.7 kg
Ediția:2nd
Editura: O'Reilly

De ce să citești această carte

Pentru inginerii de date și specialiștii în analytics care trebuie să migreze sau să implementeze soluții pe Spark 3.0. Cartea oferă un fundament solid pentru procesarea volumelor mari de date, învățându-te cum să utilizezi algoritmi de machine learning într-un mediu unificat. Este resursa ideală pentru a trece de la procesări simple la arhitecturi de date complexe și performante.


Descriere scurtă

"Data is bigger, arrives faster, and comes in a variety of formats-- and it all needs to be processed at scale for analytics or machine learning. But how can you process such varied workloads efficiently? Enter Apache Spark. Updated to include Spark 3.0, this second edition shows data engineers and data scientists why structure and unification in Spark matters. Specifically, this book explains how to perform simple and complex data analytics and employ machine learning algorithms."--Page 4 of cover.