Big Data Analytics with R
Autor Simon Walkowiaken Limba Engleză Paperback – 29 iul 2016
Dacă Essentials of Big Data Analytics de Pallavi Chavan v-a oferit cadrul teoretic necesar înțelegerii conceptelor de bază, Big Data Analytics with R aduce instrumentele practice și arhitecturile specifice pentru implementarea acestora în medii de producție. Considerăm că valoarea acestui volum rezidă în capacitatea sa de a transforma limbajul R dintr-un instrument statistic de desktop într-o soluție scalabilă pentru volume imense de date. Recomandăm această lucrare pentru abordarea sa pragmatică asupra ecosistemului modern de date, trecând dincolo de simpla sintaxă către integrarea cu infrastructuri complexe. Structura cărții este concepută pentru a ghida cititorul prin etapele critice ale fluxului de lucru: de la configurarea instanțelor în cloud pe Amazon EC2 sau Microsoft Azure, până la utilizarea cadrelor de lucru MapReduce și HDFS în clustere Hadoop multi-node. Credem că un punct forte îl reprezintă diversitatea tehnologiilor abordate; nu se limitează doar la interfațarea cu baze de date relaționale, ci explorează în detaliu conectivitatea cu sisteme NoSQL precum MongoDB și HBase. Autorul, Simon Walkowiak, pune un accent deosebit pe performanță, introducând platforma H2O și Apache Spark, inclusiv biblioteca Spark MLlib, pentru procesări distribuite și analiză predictivă rapidă. Pe parcursul celor peste 500 de pagini, textul păstrează un ton tehnic riguros, dar accesibil celor care au deja o bază în analiza datelor. Exemplele aplicate, precum analiza consumului de energie electrică în funcție de indicatori socio-demografici, demonstrează cum algoritmii pot fi executați eficient pe seturi de date care depășesc capacitatea de memorie a unui singur computer. Este o resursă esențială pentru inginerii de date care doresc să combine rigoarea statistică a R cu scalabilitatea tehnologiilor Big Data.
Preț: 334.88 lei
Preț vechi: 418.59 lei
-20%
Carte tipărită la comandă
Livrare economică 09-23 iunie
Specificații
ISBN-10: 1786466457
Pagini: 506
Dimensiuni: 191 x 235 x 28 mm
Greutate: 0.94 kg
Editura: Packt Publishing
De ce să citești această carte
Recomandăm această carte analiștilor de date și statisticienilor care doresc să depășească limitările hardware ale unei stații de lucru individuale. Veți câștiga competențe practice în operarea cu Spark, Hadoop și baze de date NoSQL direct din R, învățând să gestionați volume masive de informații în medii cloud. Este un ghid tehnic complet pentru transformarea analizei de date într-un proces scalabil și eficient.
Despre autor
Simon Walkowiak este un specialist cu experiență în analiza datelor și tehnologii Big Data. Expertiza sa se concentrează pe utilizarea limbajului R în contexte industriale, punând accent pe integrarea capacităților statistice cu infrastructuri de calcul distribuit. Prin contribuția sa în volumul de față publicat de Packt Publishing, acesta oferă o perspectivă aplicată asupra modului în care instrumentele open-source pot fi configurate pentru a rezolva probleme complexe de procesare a datelor în cloud și pe clustere Hadoop.