Data Wrangling with Python
Autor Jacqueline Kazil, Katharine Jarmulen Limba Engleză Paperback – 15 mar 2016
Problema majoră cu care se confruntă mulți analiști este limitarea instrumentelor tradiționale, precum Excel, în fața unor seturi de date dezordonate, masive sau greu accesibile. Credem că Data Wrangling with Python oferă soluția tehnică ideală pentru a depăși acest prag, fiind concepută special pentru cei fără experiență anterioară în programare. Volumul se concentrează pe aplicabilitatea imediată: învățarea sintaxei Python doar în măsura în care este necesară pentru a 'rezolva treaba'. Merită menționat că structura este una de tip atelier, ghidând cititorul prin procesul de achiziție a datelor din surse externe, precum API-uri și pagini web, urmată de tehnici riguroase de curățare și standardizare. Apreciem în mod deosebit accentul pus pe automatizare; în loc să repetați manual aceleași sarcini de editare, învățați să scrieți scripturi care gestionează fluxul de lucru în mod autonom. Abordarea diferă de Learning Data Science prin faptul că este mult mai puțin abstractă și mai mult aplicabilă; în timp ce alte titluri se concentrează pe fundamentul statistic al întregului ciclu de viață al datelor, Jacqueline Kazil și Katharine Jarmul livrează un manual de tactici concrete pentru manipularea și 'îmblânzirea' datelor brute. Este o resursă tehnică ce transformă procesarea informației dintr-o corvoadă manuală într-un proces scalabil și eficient, utilizând biblioteci Python moderne pentru a transforma haosul în perspective clare.
Preț: 253.68 lei
Preț vechi: 317.09 lei
-20%
Carte disponibilă
Livrare economică 30 aprilie-14 mai
Livrare express 15-21 aprilie pentru 49.34 lei
Specificații
ISBN-10: 1491948817
Pagini: 508
Dimensiuni: 174 x 233 x 30 mm
Greutate: 0.86 kg
Editura: O'Reilly
De ce să citești această carte
Recomandăm această carte analiștilor care simt că au atins limitele foilor de calcul și vor să automatizeze fluxurile de lucru. Cititorul câștigă abilitatea de a colecta date prin web scraping și de a curăța seturi complexe de informații folosind Python. Este un salt profesional necesar pentru oricine lucrează cu volume mari de date și dorește să elimine erorile umane prin scripting.
Despre autor
Jacqueline Kazil este un dezvoltator software cu o experiență remarcabilă în utilizarea datelor pentru interesul public. A ocupat funcția de Presidential Innovation Fellow în cadrul FEMA, unde s-a ocupat de răspunsul și recuperarea în caz de dezastre, și a lucrat pentru The Washington Post la aplicații de date premiate, precum seria 'Top Secret America'. Expertiza sa este ancorată în proiecte de anvergură la Library of Congress, ceea ce conferă cărții o perspectivă practică, bazată pe provocări reale din lumea gestionării informațiilor complexe.
Notă biografică
Descriere scurtă
Through various step-by-step exercises, you'll learn how to acquire, clean, analyze, and present data efficiently. You'll also discover how to automate your data process, schedule file- editing and clean-up tasks, process larger datasets, and create compelling stories with data you obtain.
- Quickly learn basic Python syntax, data types, and language concepts
- Work with both machine-readable and human-consumable data
- Scrape websites and APIs to find a bounty of useful information
- Clean and format data to eliminate duplicates and errors in your datasets
- Learn when to standardize data and when to test and script data cleanup
- Explore and analyze your datasets with new Python libraries and techniques
- Use Python solutions to automate your entire data-wrangling process