Python for Data Analysis
Autor Wes McKinneyen Limba Engleză Paperback – 30 sep 2022
Subliniem de la început că această lucrare nu este doar un manual teoretic, ci un ghid metodologic aplicat, esențial pentru arhitectura oricărui flux de lucru modern în știința datelor. Structura celei de-a treia ediții se concentrează pe stiva tehnologică fundamentală a ecosistemului Python, oferind o abordare practică asupra modului în care manipulăm, procesăm și „zdrobim” seturile de date complexe. Descoperim aici o integrare fluidă între mediul de calcul exploratoriu oferit de Jupyter Notebook și robustețea structurilor de date din NumPy și pandas. Notăm cu interes rigoarea cu care Wes McKinney tratează operațiunile de curățare și transformare (data wrangling), oferind soluții concrete pentru gestionarea seriilor de timp neregulate și pentru sumarizarea datelor prin mecanismul groupby. Pe linia practică a volumului Python Data Science Handbook de Jake Vanderplas, această carte se distinge prin faptul că este scrisă chiar de autorul bibliotecii pandas, oferind astfel o perspectivă „din interior” asupra optimizării performanței și a structurilor de date. În timp ce alte resurse se pot concentra pe algoritmi de învățare automată, McKinney prioritizează fundamentele solide de manipulare a datelor, fără de care nicio analiză avansată nu este posibilă. Lucrarea se poziționează ca pilon central în opera autorului, fiind versiunea extinsă și actualizată a lucrărilor sale anterioare, precum Datenanalyse mit Python. Este un instrument indispensabil care acoperă întregul ciclu de viață al analizei de date: de la încărcarea fișierelor externe până la vizualizarea informativă realizată cu Matplotlib. Ritmul este dens, dar logic, fiind ideal pentru programatorii care fac tranziția spre calculul științific.
Preț: 375.85 lei
Preț vechi: 469.81 lei
-20%
Carte disponibilă
Livrare economică 29 aprilie-13 mai
Livrare express 14-18 aprilie pentru 78.03 lei
Specificații
ISBN-10: 109810403X
Pagini: 550
Dimensiuni: 176 x 232 x 31 mm
Greutate: 1 kg
Ediția:3rd Edition
Editura: O'Reilly
De ce să citești această carte
Pentru analiștii care doresc să stăpânească instrumentele standard ale industriei, această carte oferă fundamentul tehnic necesar. Veți câștiga abilitatea de a transforma date brute în informații structurate folosind cele mai noi funcționalități din Python 3.10. Este alegerea logică dacă vreți să învățați pandas direct de la sursă, asigurându-vă un flux de lucru eficient și reproductibil în proiectele de data science.
Despre autor
Wes McKinney este un nume de referință în comunitatea open source, fiind creatorul principal al bibliotecii pandas, instrumentul standard pentru analiza datelor în limbajul Python. Absolvent al MIT cu o licență în Matematică, McKinney a lucrat ca analist cantitativ la AQR Capital Management înainte de a fonda DataPad în 2013. Experiența sa vastă ca speaker și consultant Python se reflectă în claritatea cu care explică concepte complexe de inginerie a datelor, transformând acest volum în „biblia” practicienilor din domeniu.
Notă biografică
Wes was later the cofounder and CEO of DataPad, whose technology assets and team were acquired by Cloudera in 2014. He has since become involved in big data technology, joining the Project Management Committees for the Apache Arrow and Apache Parquet projects in the Apache Software Foundation. In 2018, he founded Ursa Labs, a not-for-profit organization focused Apache Arrow development, in partnership with RStudio and Two Sigma Investments. In 2021, he cofounded technology startup Voltron Data, where he currently works as the Chief Technology Officer.
Descriere scurtă
Written by Wes McKinney, the creator of the Python pandas project, this book is a practical, modern introduction to data science tools in Python. It's ideal for analysts new to Python and for Python programmers new to data science and scientific computing. Data files and related material are available on GitHub.
- Use the Jupyter notebook and IPython shell for exploratory computing
- Learn basic and advanced features in NumPy
- Get started with data analysis tools in the pandas library
- Use flexible tools to load, clean, transform, merge, and reshape data
- Create informative visualizations with matplotlib
- Apply the pandas groupby facility to slice, dice, and summarize datasets
- Analyze and manipulate regular and irregular time series data
- Learn how to solve real-world data analysis problems with thorough, detailed examples