Cantitate/Preț
Produs

Advanced Analytics with Spark, 2e

Autor Uri Laserson, Sean Owens, Sandy Ryza, Josh Wills
en Paperback – 22 iun 2017

Suntem de părere că această lucrare reprezintă standardul de aur pentru practicienii care doresc să treacă de la teoria procesării datelor la implementări robuste în ecosistemul Apache Spark. „Advanced Analytics with Spark, 2e” nu este doar un manual tehnic, ci o colecție de strategii verificate în industrie, concepute de experți de la Cloudera. Descoperim aici o abordare bazată pe exemple concrete, unde algoritmii nu sunt prezentați izolat, ci prin prisma unor probleme reale din domenii complexe precum genomica sau sistemele antifraudă.

Pe același raft cu Big Data Analytics with Spark de Mohammed Guller, lucrarea de față se distinge prin accentul pus pe „patterns” de analiză auto-conținute, oferind soluții gata de adaptat, spre deosebire de ghidurile care se concentrează strict pe sintaxa framework-ului. Notăm cu interes tranziția fluidă între diversele limbaje de programare suportate — Java, Python și Scala — ceea ce o face accesibilă unei palete largi de ingineri de date. Față de o altă lucrare a autorilor, Advanced Analytics with Pyspark, care se concentrează pe ecosistemul Python și Spark 3, ediția de față oferă o fundație solidă pentru înțelegerea modelului de programare Spark 2.1 și a metodelor statistice aplicate pe volume masive de date. Ritmul este alert, trecând rapid de la conceptele de bază la tehnici avansate de filtrare colaborativă și detectare a anomaliilor, păstrând totodată rigoarea științifică necesară în analiza datelor la scară largă.

Citește tot Restrânge

Preț: 31617 lei

Puncte Express: 474

Carte disponibilă

Livrare economică 21 mai-04 iunie


Specificații

ISBN-13: 9781491972953
ISBN-10: 1491972955
Pagini: 280
Dimensiuni: 177 x 233 x 20 mm
Greutate: 0.41 kg
Ediția:2
Editura: O'Reilly

De ce să citești această carte

Această carte este esențială pentru inginerii și cercetătorii de date care au deja cunoștințe de bază în machine learning și doresc să aplice aceste concepte în producție. Cititorul câștigă acces la metodologii de lucru testate de experții Cloudera, învățând nu doar cum să ruleze un cod, ci cum să aleagă instrumentele potrivite pentru probleme specifice de business sau cercetare.


Despre autor

Uri Laserson este un reputat cercetător de date în cadrul Cloudera, specializat în utilizarea limbajului Python în ecosistemul Hadoop. Expertiza sa se extinde în domenii critice precum științele vieții și sănătatea, ajutând organizațiile să implementeze soluții complexe de analiză a datelor. Cu un doctorat în inginerie biomedicală obținut la MIT și o experiență antreprenorială solidă în diagnosticul genetic prin cofondarea Good Start Genetics, Laserson aduce în scrierile sale un echilibru rar între rigoarea academică și pragmatismul necesar în industria tehnologică actuală.


Descriere

In the second edition of this practical book, four Cloudera data scientists present a set of self-contained patterns for performing large-scale data analysis with Spark. The authors bring Spark, statistical methods, and real-world data sets together to teach you how to approach analytics problems by example. Updated for Spark 2.1, this edition acts as an introduction to these techniques and other best practices in Spark programming.You'll start with an introduction to Spark and its ecosystem, and then dive into patterns that apply common techniques--including classification, clustering, collaborative filtering, and anomaly detection--to fields such as genomics, security, and finance.If you have an entry-level understanding of machine learning and statistics, and you program in Java, Python, or Scala, you'll find the book's patterns useful for working on your own data applications.With this book, you will: Familiarize yourself with the Spark programming modelBecome comfortable within the Spark ecosystemLearn general approaches in data scienceExamine complete implementations that analyze large public data setsDiscover which machine learning tools make sense for particular problemsAcquire code that can be adapted to many uses