Data Science with Python and Dask
Autor Jesse Danielen Limba Engleză Paperback – 30 iul 2019
Prin parcurgerea acestui volum, cititorul va implementa un pipeline de date capabil să proceseze seturi de date care depășesc memoria RAM disponibilă, utilizând infrastructuri scalabile precum clusterele AWS și containerele Docker. Apreciem modul în care Data Science with Python and Dask reușește să extindă ecosistemul familiar PyData fără a impune o curbă de învățare abruptă, transformând fluxurile de lucru standard în procese paralele și distribuite.
Structura este riguros organizată în trei părți tehnice: bazele teoretice ale calculului scalabil, lucrul cu date structurate prin Dask DataFrames și, în final, desfășurarea aplicațiilor în producție. Observăm un accent deosebit pus pe latura practică; nu se rezumă la teorie, ci ghidează utilizatorul prin analize complexe pe baza bazei de date NYC Parking Ticket și vizualizări de mare densitate cu Datashader. Complementar volumului Scaling Python with Dask, care oferă o privire de ansamblu rapidă asupra API-urilor, lucrarea lui Jesse Daniel oferă o experiență de învățare mai aprofundată, acoperind zona critică de packaging și deploy pe care alte resurse o tratează doar tangențial.
Fiecare capitol este conceput ca un bloc constructiv pentru o arhitectură robustă, abordând atât datele structurate, cât și pe cele nestructurate prin Dask Bags. Este un ghid tehnic pentru optimizarea performanței, esențial pentru cei care au atins limitele superioare ale bibliotecii Pandas și au nevoie de o soluție nativă Python pentru calcul distribuit.
Preț: 351.98 lei
Preț vechi: 439.97 lei
-20%
Carte disponibilă
Livrare economică 04-18 mai
Livrare express 17-23 aprilie pentru 35.13 lei
Specificații
ISBN-10: 1617295604
Pagini: 296
Dimensiuni: 189 x 237 x 18 mm
Greutate: 0.51 kg
Editura: Manning Publications
De ce să citești această carte
Recomandăm această carte cercetătorilor de date care lucrează cu volume mari de informații și doresc să treacă de la procesarea locală la sisteme distribuite fără a învăța framework-uri complexe precum Spark. Veți câștiga abilități concrete în scalarea modelelor de machine learning și în vizualizarea datelor geografice de mari dimensiuni, totul prin instrumente open-source integrate în fluxul Python existent.