Principles and Practice of Big Data: Preparing, Sharing, and Analyzing Complex Information
Autor Jules J. Bermanen Limba Engleză Paperback – 25 iul 2018
Destinată studenților și profesioniștilor din diverse discipline științifice care caută o metodologie riguroasă de lucru cu seturi masive de informații, Principles and Practice of Big Data propune o abordare pragmatică și independentă de platformă. Observăm în această a doua ediție o distanțare clară de dependența față de infrastructuri costisitoare sau suite software complexe. Subliniem premisa centrală a autorului: înțelegerea profundă a datelor și formularea întrebărilor corecte sunt mai valoroase decât puterea brută de calcul a unui supercomputer.
Pe linia practică a volumului Data Simplification, dar cu focus pe pregătirea, partajarea și analiza informațiilor complexe, lucrarea de față transformă algoritmii complicați în instrucțiuni accesibile. Descoperim o structură progresivă, de la organizarea datelor nestructurate și utilizarea ontologiilor, până la tehnici de integrare și interoperabilitate software. Spre deosebire de Big Data de Kuan-Ching Li, care explorează metode computaționale vaste, Jules J. Berman se concentrează pe simplitate, oferind fragmente de cod Python și pseudocod care pot fi rulate pe echipamente standard.
Poziționată ca o continuare a lucrării Principles of Big Data, această ediție rafinează temele recurente din opera autorului, precum clasificarea și ontologiile, explorate detaliat și în Classification Made Relevant. Cartea nu ignoră nici aspectele etice sau tehnice ale securității, dedicând spații ample proceselor de identificare și de-identificare, esențiale în contextul reglementărilor actuale privind datele.
Preț: 370.47 lei
Preț vechi: 595.16 lei
-38%
Carte tipărită la comandă
Livrare economică 28 mai-11 iunie
Livrare express 29 aprilie-05 mai pentru 160.89 lei
Specificații
ISBN-10: 0128156090
Pagini: 480
Dimensiuni: 191 x 235 x 30 mm
Greutate: 1.01 kg
Ediția:2. Auflage
Editura: ELSEVIER SCIENCE
De ce să citești această carte
Recomandăm această lucrare profesioniștilor care vor să stăpânească Big Data fără a investi în hardware scump sau software de tip enterprise. Cititorul câștigă o metodologie clară pentru transformarea datelor brute în resurse analizabile, învățând să evite eșecurile comune prin utilizarea unor algoritmi simpli, implementați în Python. Este un ghid esențial pentru autonomie tehnică în analiza datelor complexe.
Despre autor
Jules J. Berman deține un profil academic remarcabil, cu două diplome de licență de la MIT în Matematică și Științe ale Pământului, un doctorat la Temple University și titlul de doctor în medicină de la University of Miami. Expertiza sa vastă s-a consolidat în cadrul U.S. National Institutes of Health și ca șef al secțiilor de Patologie Anatomică și Citopatologie la Baltimore Veterans Administration Medical Center. Această rigoare științifică se reflectă în abordarea sa asupra datelor, autorul publicând numeroase lucrări la intersecția dintre informatică, biologie și medicină, precum Taxonomic Guide to Infectious Diseases și Evolution's Clinical Guidebook.
Cuprins
1. Introduction 2. Providing Structure to Unstructured Data 3. Identification, Deidentification, and Reidentification 4. Metadata, Semantics, and Triples 5. Classifications and Ontologies 6. Introspection 7. Data Integration and Software Interoperability 8. Immutability and Immortality 9. Assessing the Adequacy of a Big Data Resource 10. Measurement 11. Indispensable Tips for Fast and Simple Big Data Analysis 12. Finding the Clues in Large Collections of Data 13. Using Random Numbers to Bring Your Big Data Analytic Problems Down to Size 14. Special Considerations in Big Data Analysis 15. Big Data Failures and How to Avoid (Some of) Them 16. Legalities 17. Data Sharing 18. Data Reanalysis: Much More Important than Analysis 19. Repurposing Big Data
Descriere
Principles and Practice of Big Data: Preparing, Sharing, and Analyzing Complex Information, Second Edition updates and expands on the first edition, bringing a set of techniques and algorithms that are tailored to Big Data projects. The book stresses the point that most data analyses conducted on large, complex data sets can be achieved without the use of specialized suites of software (e.g., Hadoop), and without expensive hardware (e.g., supercomputers). The core of every algorithm described in the book can be implemented in a few lines of code using just about any popular programming language (Python snippets are provided).
Through the use of new multiple examples, this edition demonstrates that if we understand our data, and if we know how to ask the right questions, we can learn a great deal from large and complex data collections. The book will assist students and professionals from all scientific backgrounds who are interested in stepping outside the traditional boundaries of their chosen academic disciplines.
- Presents new methodologies that are widely applicable to just about any project involving large and complex datasets
- Offers readers informative new case studies across a range scientific and engineering disciplines
- Provides insights into semantics, identification, de-identification, vulnerabilities and regulatory/legal issues
- Utilizes a combination of pseudocode and very short snippets of Python code to show readers how they may develop their own projects without downloading or learning new software