Advanced Analytics with Spark, 2e
Autor Uri Laserson, Sean Owens, Sandy Ryza, Josh Willsen Paperback – 22 iun 2017
Suntem de părere că această lucrare reprezintă standardul de aur pentru practicienii care doresc să treacă de la teoria procesării datelor la implementări robuste în ecosistemul Apache Spark. „Advanced Analytics with Spark, 2e” nu este doar un manual tehnic, ci o colecție de strategii verificate în industrie, concepute de experți de la Cloudera. Descoperim aici o abordare bazată pe exemple concrete, unde algoritmii nu sunt prezentați izolat, ci prin prisma unor probleme reale din domenii complexe precum genomica sau sistemele antifraudă.
Pe același raft cu Big Data Analytics with Spark de Mohammed Guller, lucrarea de față se distinge prin accentul pus pe „patterns” de analiză auto-conținute, oferind soluții gata de adaptat, spre deosebire de ghidurile care se concentrează strict pe sintaxa framework-ului. Notăm cu interes tranziția fluidă între diversele limbaje de programare suportate — Java, Python și Scala — ceea ce o face accesibilă unei palete largi de ingineri de date. Față de o altă lucrare a autorilor, Advanced Analytics with Pyspark, care se concentrează pe ecosistemul Python și Spark 3, ediția de față oferă o fundație solidă pentru înțelegerea modelului de programare Spark 2.1 și a metodelor statistice aplicate pe volume masive de date. Ritmul este alert, trecând rapid de la conceptele de bază la tehnici avansate de filtrare colaborativă și detectare a anomaliilor, păstrând totodată rigoarea științifică necesară în analiza datelor la scară largă.
Preț: 316.17 lei
Carte disponibilă
Livrare economică 21 mai-04 iunie
Specificații
ISBN-10: 1491972955
Pagini: 280
Dimensiuni: 177 x 233 x 20 mm
Greutate: 0.41 kg
Ediția:2
Editura: O'Reilly
De ce să citești această carte
Această carte este esențială pentru inginerii și cercetătorii de date care au deja cunoștințe de bază în machine learning și doresc să aplice aceste concepte în producție. Cititorul câștigă acces la metodologii de lucru testate de experții Cloudera, învățând nu doar cum să ruleze un cod, ci cum să aleagă instrumentele potrivite pentru probleme specifice de business sau cercetare.
Despre autor
Uri Laserson este un reputat cercetător de date în cadrul Cloudera, specializat în utilizarea limbajului Python în ecosistemul Hadoop. Expertiza sa se extinde în domenii critice precum științele vieții și sănătatea, ajutând organizațiile să implementeze soluții complexe de analiză a datelor. Cu un doctorat în inginerie biomedicală obținut la MIT și o experiență antreprenorială solidă în diagnosticul genetic prin cofondarea Good Start Genetics, Laserson aduce în scrierile sale un echilibru rar între rigoarea academică și pragmatismul necesar în industria tehnologică actuală.