Cantitate/Preț
Produs

Veridical Data Science

Autor Bin Yu, Rebecca L. Barter
en Limba Engleză Hardback – 15 oct 2024

În domeniul științei datelor (data science), trecerea de la mediul academic la aplicațiile industriale relevă adesea o discrepanță majoră între modelele teoretice perfecte și realitatea datelor brute. Remarcăm modul în care Veridical Data Science, semnată de Bin Yu și Rebecca L. Barter, refuză să trateze disciplina ca pe un proces liniar, alegând în schimb să exploreze provocările intrinseci ale proiectelor reale. Autorii propun un cadru metodologic inovator, denumit PCS (Predictability, Computability, Stability), conceput pentru a ancora rezultatele analizelor în realitate și pentru a gestiona incertitudinea ce derivă din deciziile subiective ale cercetătorului. Observăm o structură tehnică riguroasă care acoperă întreg ciclul de viață al unui proiect, de la formularea întrebării de domeniu până la implementare. Spre deosebire de manualele clasice care se concentrează exclusiv pe algoritmi, acest volum publicat de MIT Press Ltd pune accent pe gândirea critică și pe stabilitatea modelelor. Complementar lucrării Statistics for Scientists de Umberto Michelucci, care oferă o introducere concisă în conceptele statistice fundamentale, volumul de față merge mai departe, integrând stabilitatea computațională și oferind suport practic prin cod R și Python pentru probleme complexe de modelare. De asemenea, dacă Doing Data Science de Cathy O'Neil oferă o perspectivă largă asupra industriei prin studii de caz de la companii mari, Veridical Data Science furnizează fundamentul metodologic necesar pentru a asigura reproductibilitatea și responsabilitatea rezultatelor obținute. Apreciem includerea exercițiilor și a soluțiilor, elemente care transformă acest format hardback într-un instrument de lucru esențial pentru cei care doresc să depășească faza de simplu utilizator de biblioteci software, devenind arhitecți de soluții de date veridice.

Citește tot Restrânge

Preț: 52731 lei

Preț vechi: 65913 lei
-20%

Puncte Express: 791

Carte disponibilă

Livrare economică 04-18 mai
Livrare express 18-24 aprilie pentru 5332 lei


Specificații

ISBN-13: 9780262049191
ISBN-10: 0262049198
Pagini: 526
Dimensiuni: 157 x 232 x 37 mm
Greutate: 0.96 kg
Editura: MIT Press Ltd

De ce să citești această carte

Recomandăm această carte profesioniștilor și studenților care vor să înțeleagă rigoarea din spatele deciziilor de modelare. Cititorul câștigă o metodologie clară (PCS) pentru a valida dacă rezultatele obținute sunt stabile sau doar artefacte ale datelor. Este un ghid practic esențial pentru oricine dorește să construiască sisteme de analiză a datelor care să reziste testului realității, dincolo de simplele exerciții teoretice.


Descriere

Using real-world data case studies, this innovative and accessible textbook introduces an actionable framework for conducting trustworthy data science. Most textbooks present data science as a linear analytic process involving a set of statistical and computational techniques without accounting for the challenges intrinsic to real-world applications. Veridical Data Science, by contrast, embraces the reality that most projects begin with an ambiguous domain question and messy data; it acknowledges that datasets are mere approximations of reality while analyses are mental constructs. Bin Yu and Rebecca Barter employ the innovative Predictability, Computability, and Stability (PCS) framework to assess the trustworthiness and relevance of data-driven results relative to three sources of uncertainty that arise throughout the data science life cycle: the human decisions and judgment calls made during data collection, cleaning, and modeling. By providing real-world data case studies, intuitive explanations of common statistical and machine learning techniques, and supplementary R and Python code, Veridical Data Science offers a clear and actionable guide for conducting responsible data science. Requiring little background knowledge, this lucid, self-contained textbook provides a solid foundation and principled framework for future study of advanced methods in machine learning, statistics, and data science. Presents the Predictability, Computability, and Stability (PCS) methodology for producing trustworthy data-driven resultsTeaches how a data science project should be conducted from beginning to end, including extensive discussion of the data scientist's decision-making processCultivates critical thinking throughout the entire data science life cycleProvides practical examples and illuminating case studies of real-world data analysis problems with associated code, exercises, and solutionsSuitable for advanced undergraduate and graduate students, domain scientists, and practitioners