Cantitate/Preț
Produs

Big Data Analytics with R

Autor Simon Walkowiak
en Limba Engleză Paperback – 29 iul 2016

Dacă Essentials of Big Data Analytics de Pallavi Chavan v-a oferit cadrul teoretic necesar înțelegerii conceptelor de bază, Big Data Analytics with R aduce instrumentele practice și arhitecturile specifice pentru implementarea acestora în medii de producție. Considerăm că valoarea acestui volum rezidă în capacitatea sa de a transforma limbajul R dintr-un instrument statistic de desktop într-o soluție scalabilă pentru volume imense de date. Recomandăm această lucrare pentru abordarea sa pragmatică asupra ecosistemului modern de date, trecând dincolo de simpla sintaxă către integrarea cu infrastructuri complexe. Structura cărții este concepută pentru a ghida cititorul prin etapele critice ale fluxului de lucru: de la configurarea instanțelor în cloud pe Amazon EC2 sau Microsoft Azure, până la utilizarea cadrelor de lucru MapReduce și HDFS în clustere Hadoop multi-node. Credem că un punct forte îl reprezintă diversitatea tehnologiilor abordate; nu se limitează doar la interfațarea cu baze de date relaționale, ci explorează în detaliu conectivitatea cu sisteme NoSQL precum MongoDB și HBase. Autorul, Simon Walkowiak, pune un accent deosebit pe performanță, introducând platforma H2O și Apache Spark, inclusiv biblioteca Spark MLlib, pentru procesări distribuite și analiză predictivă rapidă. Pe parcursul celor peste 500 de pagini, textul păstrează un ton tehnic riguros, dar accesibil celor care au deja o bază în analiza datelor. Exemplele aplicate, precum analiza consumului de energie electrică în funcție de indicatori socio-demografici, demonstrează cum algoritmii pot fi executați eficient pe seturi de date care depășesc capacitatea de memorie a unui singur computer. Este o resursă esențială pentru inginerii de date care doresc să combine rigoarea statistică a R cu scalabilitatea tehnologiilor Big Data.

Citește tot Restrânge

Preț: 33488 lei

Preț vechi: 41859 lei
-20%

Puncte Express: 502

Carte tipărită la comandă

Livrare economică 09-23 iunie


Specificații

ISBN-13: 9781786466457
ISBN-10: 1786466457
Pagini: 506
Dimensiuni: 191 x 235 x 28 mm
Greutate: 0.94 kg
Editura: Packt Publishing

De ce să citești această carte

Recomandăm această carte analiștilor de date și statisticienilor care doresc să depășească limitările hardware ale unei stații de lucru individuale. Veți câștiga competențe practice în operarea cu Spark, Hadoop și baze de date NoSQL direct din R, învățând să gestionați volume masive de informații în medii cloud. Este un ghid tehnic complet pentru transformarea analizei de date într-un proces scalabil și eficient.


Despre autor

Simon Walkowiak este un specialist cu experiență în analiza datelor și tehnologii Big Data. Expertiza sa se concentrează pe utilizarea limbajului R în contexte industriale, punând accent pe integrarea capacităților statistice cu infrastructuri de calcul distribuit. Prin contribuția sa în volumul de față publicat de Packt Publishing, acesta oferă o perspectivă aplicată asupra modului în care instrumentele open-source pot fi configurate pentru a rezolva probleme complexe de procesare a datelor în cloud și pe clustere Hadoop.


Descriere scurtă

Utilize R to uncover hidden patterns in your Big Data About This Book Perform computational analyses on Big Data to generate meaningful results Get a practical knowledge of R programming language while working on Big Data platforms like Hadoop, Spark, H2O and SQL/NoSQL databases, Explore fast, streaming, and scalable data analysis with the most cutting-edge technologies in the market Who This Book Is For This book is intended for Data Analysts, Scientists, Data Engineers, Statisticians, Researchers, who want to integrate R with their current or future Big Data workflows. It is assumed that readers have some experience in data analysis and understanding of data management and algorithmic processing of large quantities of data, however they may lack specific skills related to R. What You Will Learn Learn about current state of Big Data processing using R programming language and its powerful statistical capabilities Deploy Big Data analytics platforms with selected Big Data tools supported by R in a cost-effective and time-saving manner Apply the R language to real-world Big Data problems on a multi-node Hadoop cluster, e.g. electricity consumption across various socio-demographic indicators and bike share scheme usage Explore the compatibility of R with Hadoop, Spark, SQL and NoSQL databases, and H2O platform In Detail Big Data analytics is the process of examining large and complex data sets that often exceed the computational capabilities. R is a leading programming language of data science, consisting of powerful functions to tackle all problems related to Big Data processing. The book will begin with a brief introduction to the Big Data world and its current industry standards. With introduction to the R language and presenting its development, structure, applications in real world, and its shortcomings. Book will progress towards revision of major R functions for data management and transformations. Readers will be introduce to Cloud based Big Data solutions (e.g. Amazon EC2 instances and Amazon RDS, Microsoft Azure and its HDInsight clusters) and also provide guidance on R connectivity with relational and non-relational databases such as MongoDB and HBase etc. It will further expand to include Big Data tools such as Apache Hadoop ecosystem, HDFS and MapReduce frameworks. Also other R compatible tools such as Apache Spark, its machine learning library Spark MLlib, as well as H2O. Style and approach This book will serve as a practical guide to tackling Big Data problems using R programming language and its statistical environment. Each section of the book will present you with concise and easy-to-follow steps on how to process, transform and analyse large data sets."

Notă biografică

In Discussion regarding updating his book. Simon Walkowiak is a former data scientist at the UK Data Archive (University of Essex) and currently is the Managing Director of Mind Project Ltd and a Data Scientist Meetup organizer based in London.