Cantitate/Preț
Produs

Data Science with Java

Autor Michael Brzustowicz
en Limba Engleză Paperback – 18 iul 2017

Subliniem o abordare pragmatică încă din primele capitole: implementarea unui sistem de prelucrare a datelor prin Hadoop MapReduce folosind componente personalizate. Michael Brzustowicz nu se limitează la a prezenta biblioteci software, ci ghidează inginerul software prin procesul riguros de transformare a datelor brute în structuri matriciale pure, gata pentru analiză statistică. Ne-a atras atenția modul în care autorul echilibrează teoria matematică necesară cu implementarea practică în Java, oferind soluții pentru curățarea și validarea seturilor de date de mari dimensiuni. Data Science with Java se distinge prin accentul pus pe scalabilitate și robustețe, calități intrinseci ale ecosistemului Java, adesea neglijate în favoarea limbajelor Python sau R. Cititorul care a aplicat deja ideile din Practical Data Science with Hadoop and Spark: Designing and Building Effective Analytics at Scale de Ofer Mendelevitch va găsi aici o completare tehnică esențială, orientată spre implementarea la nivel de cod și optimizarea fluxurilor de date prin algebră liniară și operațiuni de date specifice. În timp ce alte resurse se concentrează pe vizualizare, acest volum de la O'Reilly prioritizează arhitectura sistemului și validitatea originii datelor. Structura este una progresivă, de la IO și algebră, la învățare supervizată și nesupervizată. Apreciem în mod deosebit secțiunile dedicate evaluării succesului algoritmilor, oferind metrici clare pentru performanța modelelor de predicție. Este un manual tehnic care transformă un inginer Java într-un specialist capabil să gestioneze proiecte complexe de analiză a datelor într-un mediu de producție stabil.

Citește tot Restrânge

Preț: 29681 lei

Preț vechi: 37102 lei
-20%

Puncte Express: 445

Carte disponibilă

Livrare economică 04-18 mai
Livrare express 18-24 aprilie pentru 3125 lei


Specificații

ISBN-13: 9781491934111
ISBN-10: 1491934115
Pagini: 236
Dimensiuni: 177 x 231 x 20 mm
Greutate: 0.42 kg
Ediția:1
Editura: O'Reilly

De ce să citești această carte

Recomandăm această carte inginerilor software Java care doresc să stăpânească întregul flux de data science fără a părăsi ecosistemul JVM. Veți câștiga o înțelegere profundă a matematicii din spatele algoritmilor și veți învăța să construiți sisteme analitice scalabile folosind Hadoop MapReduce. Este resursa ideală pentru trecerea de la dezvoltarea de aplicații standard la arhitecturi de date complexe și robuste.


Despre autor

Michael Brzustowicz este un specialist cu experiență în domeniul analizei datelor, concentrat pe aplicarea metodelor matematice și statistice în medii de producție scalabile. Expertiza sa se reflectă în capacitatea de a traduce concepte teoretice abstracte în cod Java eficient. Prin lucrarea publicată la O'Reilly, el oferă comunității de dezvoltatori o punte necesară între ingineria software tradițională și disciplina emergentă a științei datelor, punând accent pe utilizarea instrumentelor enterprise precum Hadoop.


Notă biografică

Michael Brzustowicz is a physicist turned data scientist. After a PhD from Indiana University, Michael spent his post doctoral years at Stanford University where he shot high powered Xrays at tiny molecules. Jumping ship from academia, he worked at many startups (including his own) and has been pioneering big data techniques all the way. Michael specializes in building distributed data systems and extracting knowledge from massive data. He spends most of his time writing customized, multithreaded code for statistical modeling and machine learning approaches to everyday big data problems. Michael now teaches Big Data, parttime, at the University of San Francisco.

Descriere

Data Science is booming thanks to R and Python, but Java brings the robustness, convenience, and ability to scale critical to today's data science applications. With this practical book, Java software engineers looking to add data science skills will take a logical journey through the data science pipeline. Author Michael Brzustowicz explains the basic math theory behind each step of the data science process, as well as how to apply these concepts with Java. You'll learn the critical roles that data IO, linear algebra, statistics, data operations, learning and prediction, and Hadoop MapReduce play in the process. Throughout this book, you'll find code examples you can use in your applications. Examine methods for obtaining, cleaning, and arranging data into its purest form Understand the matrix structure that your data should take Learn basic concepts for testing the origin and validity of data Transform your data into stable and usable numerical values Understand supervised and unsupervised learning algorithms, and methods for evaluating their success Get up and running with MapReduce, using customized components suitable for data science algorithms