Introducing .NET for Apache Spark
Autor Ed Elliotten Limba Engleză Paperback – 14 apr 2021
Remarcăm încă din primele pagini o abordare orientată spre execuție: autorul ne ghidează prin configurarea unui mediu local de dezvoltare pentru a rula primul program C# care interacționează cu nucleul Spark. Această abordare practică transformă imediat teoria procesării distribuite într-o experiență palpabilă pentru ecosistemul Microsoft. Credem că valoarea principală a lucrării rezidă în eliminarea barierei lingvistice; dezvoltatorii nu mai sunt nevoiți să migreze spre Python sau Scala pentru a manipula seturi masive de date, ci pot folosi bibliotecile .NET existente. Structura volumului Introducing .NET for Apache Spark este riguros segmentată în patru părți fundamentale. Începând cu bazele programării în .NET pentru Spark, progresia continuă natural spre detalii tehnice despre DataFrame API și Spark SQL, culminând cu secțiuni dedicate depanării (troubleshooting) și tehnologiei Delta Lake. Cititorul care a aplicat ideile de bază din Beginning Apache Spark 2 va găsi aici puntea de legătură specifică pentru C# și F#, completând cunoștințele generale despre RDD-uri cu implementări native .NET. În timp ce Practical Apache Spark se concentrează pe Scala și configurarea clusterelor, lucrarea de față se distinge prin accentul pus pe utilizarea funcțiilor definite de utilizator (UDF) și integrarea cu Apache Hive direct din codul .NET. Putem afirma că Ed Elliott reușește să demonstreze că performanța nu este sacrificată prin utilizarea binding-urilor .NET. Cartea explică tehnic cum sarcinile de procesare sunt distribuite pe mai multe noduri de calcul, oferind exemple clare pentru procesarea în flux (structured streaming) și analize predictive prin Spark Machine Learning API. Este o resursă esențială pentru modernizarea fluxurilor de lucru în companiile care depind de infrastructura Microsoft și doresc scalabilitate orizontală.
Preț: 315.92 lei
Preț vechi: 394.89 lei
-20%
Carte disponibilă
Livrare economică 06-20 iunie
Specificații
ISBN-10: 1484269918
Pagini: 280
Ilustrații: XV, 262 p. 41 illus.
Dimensiuni: 178 x 254 x 16 mm
Greutate: 0.53 kg
Ediția:1st edition
Editura: Apress
Locul publicării:Berkeley, CA, United States
De ce să citești această carte
Recomandăm această carte programatorilor .NET care doresc să intre în universul Big Data fără a învăța o limbă nouă. Veți câștiga capacitatea de a scrie aplicații de procesare distribuită extrem de rapide, folosind C# sau F#. Este un ghid tehnic indispensabil pentru a aduce puterea de calcul a Apache Spark în proiectele voastre enterprise, acoperind totul de la instalare la deployment în cloud.
Despre autor
Ed Elliott este un specialist în tehnologii de date, recunoscut pentru expertiza sa în integrarea ecosistemului .NET cu soluții de procesare la scară largă. Prin activitatea sa, Elliott se concentrează pe democratizarea accesului la instrumente de Big Data pentru dezvoltatorii care utilizează limbajele Microsoft, oferind soluții practice pentru scenarii complexe de inginerie a datelor. În această lucrare publicată de Apress, el își folosește experiența pentru a simplifica adopția Apache Spark în mediile de dezvoltare tradiționale.
Descriere scurtă
- Install and configure Spark .NET on Windows, Linux, and macOS
- Write Apache Spark programs in C# and F# using the .NET bindings
- Access and invoke the Apache Spark APIs from .NET with the same high performance as Python, Scala, and R
- Encapsulate functionality in user-defined functions
- Transform and aggregate large datasets
- Execute SQL queries against files through Apache Hive
- Distribute processing of large datasets across multiple servers
- Create your own batch, streaming, and machine learning programs