SQL for Data Science: Data-Centric Systems and Applications
Autor Antonio Badiaen Limba Engleză Paperback – 10 noi 2020
Structura progresivă: de la concept la implementare, definește acest manual publicat de Springer. Considerăm că SQL for Data Science se distanțează de abordările academice rigide, ancorând limbajul SQL direct în fluxul de lucru al unui analist de date. Autorul, Antonio Badia, organizează materialul în jurul ciclului de viață al datelor, acordând o atenție deosebită etapelor de încărcare, curățare și preprocesare — faze care ocupă adesea cea mai mare parte a timpului într-un proiect real, dar sunt ignorate în alte lucrări.
Prin parcurgerea celor șase capitole, cititorul trece de la înțelegerea modelului relațional la tehnici de analiză exploratorie și transformare a datelor. Merită menționat că volumul nu se limitează la SQL-ul standard; acesta explorează gestionarea datelor non-tradiționale, cum ar fi formatul XML și textul brut. Un element distinctiv este capitolul final, care demonstrează cum cunoștințele de SQL pot fi eficientizate prin integrarea cu [R](language) și [Python](language), facilitând tranziția către biblioteci avansate de data mining.
Cititorul care a aplicat ideile de bază din SQL Primer de Rahul Batra va găsi aici contextul necesar pentru a trece de la simple interogări la o metodologie structurată de analiză. Dacă în SQL Primer accentul cade pe sintaxa agnostică, Antonio Badia oferă o perspectivă aplicată, utilizând MySQL și PostgreSQL pentru a simula scenarii reale de producție. În contextul operei sale anterioare, precum Quantifiers in Action, unde autorul explora logica formală a limbajelor de interogare, această lucrare reprezintă o adaptare pragmatică, tradusă într-un limbaj accesibil și lipsit de jargon excesiv.
Din seria Data-Centric Systems and Applications
- 20%
Preț: 1024.33 lei - 20%
Preț: 332.71 lei - 20%
Preț: 637.96 lei - 20%
Preț: 587.78 lei - 20%
Preț: 334.80 lei - 20%
Preț: 493.00 lei - 20%
Preț: 329.17 lei - 20%
Preț: 675.48 lei - 20%
Preț: 625.13 lei - 28%
Preț: 344.13 lei - 20%
Preț: 407.53 lei - 37%
Preț: 713.62 lei - 20%
Preț: 465.25 lei - 20%
Preț: 290.48 lei - 20%
Preț: 470.81 lei - 20%
Preț: 495.48 lei - 20%
Preț: 362.86 lei - 20%
Preț: 806.57 lei - 20%
Preț: 322.85 lei - 20%
Preț: 358.66 lei - 20%
Preț: 500.85 lei - 20%
Preț: 481.37 lei - 15%
Preț: 586.60 lei - 20%
Preț: 1113.77 lei
Preț: 349.86 lei
Preț vechi: 437.33 lei
-20%
Carte tipărită la comandă
Livrare economică 09-23 iunie
Specificații
ISBN-10: 3030575918
Pagini: 300
Ilustrații: XI, 285 p. 16 illus.
Dimensiuni: 155 x 235 x 17 mm
Greutate: 0.46 kg
Ediția:1st edition 2020
Editura: Springer
Colecția Data-Centric Systems and Applications
Seria Data-Centric Systems and Applications
Locul publicării:Cham, Switzerland
De ce să citești această carte
Recomandăm această carte profesioniștilor care doresc să utilizeze SQL ca instrument principal în data science, nu doar pentru extragerea datelor, ci și pentru curățarea și pregătirea lor. Cititorul câștigă o înțelegere clară a modului în care bazele de date interacționează cu Python și R. Este un ghid esențial pentru cei care preferă învățarea prin practică, oferind numeroase exerciții aplicate în MySQL și Postgres.
Despre autor
Antonio Badia este un expert în sisteme de baze de date, cunoscut pentru capacitatea sa de a îmbina rigoarea logică cu aplicațiile practice în informatică. În lucrarea sa anterioară, Quantifiers in Action, a explorat aspectele teoretice ale cuantificării în limbajele de interogare și logice, dezvoltând limbajul GQs. Cu SQL for Data Science, Badia își folosește expertiza pentru a simplifica concepte complexe, făcând legătura între gestiunea tradițională a bazelor de date și cerințele moderne ale analizei de date, punând accent pe utilizarea intuitivă a tehnologiei.
Cuprins
Notă biografică
Textul de pe ultima copertă
The book is organized as follows. Chapter 1 describes the data life cycle, i.e. the sequence of stages from data acquisition to archiving, that data goes through as it is prepared and then actually analyzed, together with the different activities that take place at each stage. Chapter 2 gets into databases proper, explaining how relational databases organize data. Non-traditional data, like XML and text, are also covered. Chapter 3 introduces SQL queries, but unlike traditional textbooks, queries and their parts are described around typical data analysis tasks like data exploration, cleaning and transformation.Chapter 4 introduces some basic techniques for data analysis and shows how SQL can be used for some simple analyses without too much complication. Chapter 5 introduces additional SQL constructs that are important in a variety of situations and thus completes the coverage of SQL queries. Lastly, chapter 6 briefly explains how to use SQL from within R and from within Python programs. It focuses on how these languages can interact with a database, and how what has been learned about SQL can be leveraged to make life easier when using R or Python. All chapters contain a lot of examples and exercises on the way, and readers are encouraged to install the two open-source database systems (MySQL and Postgres) that are used throughout the book in order to practice and work on the exercises, because simply reading the book is much less useful than actually using it.
This book is for anyone interested in data science and/or databases. It just demands a bit of computer fluency, butno specific background on databases or data analysis. All concepts are introduced intuitively and with a minimum of specialized jargon. After going through this book, readers should be able to profitably learn more about data mining, machine learning, and database management from more advanced textbooks and courses.