Cantitate/Preț
Produs

Data Wrangling with Python

Autor Jacqueline Kazil, Katharine Jarmul
en Limba Engleză Paperback – 15 mar 2016

Problema majoră cu care se confruntă mulți analiști este limitarea instrumentelor tradiționale, precum Excel, în fața unor seturi de date dezordonate, masive sau greu accesibile. Credem că Data Wrangling with Python oferă soluția tehnică ideală pentru a depăși acest prag, fiind concepută special pentru cei fără experiență anterioară în programare. Volumul se concentrează pe aplicabilitatea imediată: învățarea sintaxei Python doar în măsura în care este necesară pentru a 'rezolva treaba'. Merită menționat că structura este una de tip atelier, ghidând cititorul prin procesul de achiziție a datelor din surse externe, precum API-uri și pagini web, urmată de tehnici riguroase de curățare și standardizare. Apreciem în mod deosebit accentul pus pe automatizare; în loc să repetați manual aceleași sarcini de editare, învățați să scrieți scripturi care gestionează fluxul de lucru în mod autonom. Abordarea diferă de Learning Data Science prin faptul că este mult mai puțin abstractă și mai mult aplicabilă; în timp ce alte titluri se concentrează pe fundamentul statistic al întregului ciclu de viață al datelor, Jacqueline Kazil și Katharine Jarmul livrează un manual de tactici concrete pentru manipularea și 'îmblânzirea' datelor brute. Este o resursă tehnică ce transformă procesarea informației dintr-o corvoadă manuală într-un proces scalabil și eficient, utilizând biblioteci Python moderne pentru a transforma haosul în perspective clare.

Citește tot Restrânge

Preț: 25368 lei

Preț vechi: 31709 lei
-20%

Puncte Express: 381

Carte disponibilă

Livrare economică 30 aprilie-14 mai
Livrare express 15-21 aprilie pentru 4934 lei


Specificații

ISBN-13: 9781491948811
ISBN-10: 1491948817
Pagini: 508
Dimensiuni: 174 x 233 x 30 mm
Greutate: 0.86 kg
Editura: O'Reilly

De ce să citești această carte

Recomandăm această carte analiștilor care simt că au atins limitele foilor de calcul și vor să automatizeze fluxurile de lucru. Cititorul câștigă abilitatea de a colecta date prin web scraping și de a curăța seturi complexe de informații folosind Python. Este un salt profesional necesar pentru oricine lucrează cu volume mari de date și dorește să elimine erorile umane prin scripting.


Despre autor

Jacqueline Kazil este un dezvoltator software cu o experiență remarcabilă în utilizarea datelor pentru interesul public. A ocupat funcția de Presidential Innovation Fellow în cadrul FEMA, unde s-a ocupat de răspunsul și recuperarea în caz de dezastre, și a lucrat pentru The Washington Post la aplicații de date premiate, precum seria 'Top Secret America'. Expertiza sa este ancorată în proiecte de anvergură la Library of Congress, ceea ce conferă cărții o perspectivă practică, bazată pe provocări reale din lumea gestionării informațiilor complexe.


Notă biografică

Jacqueline Kazil is a data lover. In her career, she has worked in technology focusing in finance, government, and journalism. Most notably, she is a former Presidential Innovation Fellow and co-founded a technology organization in government called 18F. Her career has consisted of many data science and wrangling projects including Geoq, an open source mapping workflow tool, Congress.gov remake, and Top Secret America. She is active in the Python and data related communities -- Python Software Foundation, PyLadies, Women Data Science DC, and more. She teaches Python in Washington, D.C. at meetups, conferences, and mini bootcamps. She often pair programs with her sidekick, Ellie (@ellie_the_brave). You can find her on Twitter @jackiekazil or follow her blog, The coderSnorts (https://medium.com/coder-snorts).
Katharine Jarmul is a Python developer who enjoys data analysis and acquisition, web scraping, teaching Python and all things Unix. She has worked at small and large start ups before starting her consulting career overseas. Originally from Los Angeles, she learned Python while working at the Washington Post in 2008. As one of the founders of PyLadies (http://pyladies.org/), Katharine hopes to promote diversity in Python and other open source languages through education and training. She has led numerous workshops and tutorials ranging from beginner to advanced topics in Python. For more information on upcoming trainings, reach out to her on Twitter (http://twitter.com/kjam) or her her web site (http://kjamistan.com/).

Descriere scurtă

How do you take your data analysis skills beyond Excel to the next level? By learning just enough Python to get stuff done. This hands-on guide shows non-programmers like you how to process information that's initially too messy or difficult to access. You don't need to know a thing about the Python programming language to get started.
Through various step-by-step exercises, you'll learn how to acquire, clean, analyze, and present data efficiently. You'll also discover how to automate your data process, schedule file- editing and clean-up tasks, process larger datasets, and create compelling stories with data you obtain.
  • Quickly learn basic Python syntax, data types, and language concepts
  • Work with both machine-readable and human-consumable data
  • Scrape websites and APIs to find a bounty of useful information
  • Clean and format data to eliminate duplicates and errors in your datasets
  • Learn when to standardize data and when to test and script data cleanup
  • Explore and analyze your datasets with new Python libraries and techniques
  • Use Python solutions to automate your entire data-wrangling process