Automated Data Collection with R
Autor Simon Munzert, Christian Rubba, Peter Meißner, Dominic Nyhuisen Limba Engleză Hardback – 20 ian 2015
În domeniul data mining și al analizei computaționale, capacitatea de a extrage informații brute și de a le transforma în seturi de date structurate reprezintă o competență critică. Automated Data Collection with R oferă un ghid aplicat, orientat spre practică, pentru utilizatorii limbajului R care doresc să stăpânească procesele de web scraping și text mining. Notăm cu interes modul în care autorii, Simon Munzert și echipa sa, reușesc să demistifice arhitectura web-ului, oferind explicații tehnice riguroase pentru protocoalele HTTP și formatele de date precum HTML, XML sau JSON. Putem afirma că volumul se distinge prin abordarea sa holistică: nu se limitează doar la extragerea datelor, ci explorează și managementul textului prin tehnici avansate de analiză supervizată și nesupervizată. Cititorul care a aplicat deja conceptele fundamentale din XML and Web Technologies for Data Sciences with R de Deborah Nolan va găsi aici o continuare firească, centrată pe automatizarea fluxurilor de lucru și pe utilizarea eficientă a XPath și a expresiilor regulate pentru interogarea documentelor web complexe. Structura cărții este solid ancorată în realitate, fiecare capitol fiind susținut de studii de caz și exerciții care permit testarea imediată a codului R furnizat. Spre deosebire de alte introduceri în domeniu, acest manual publicat de Wiley face trecerea de la simpla colectare la prelucrarea datelor pentru baze de date SQL, oferind instrumentele necesare pentru a gestiona volume mari de informații neevaluate. Este o resursă tehnică esențială pentru cei care au nevoie de date proaspete din mediul online pentru cercetări academice sau analize de piață.
Preț: 463.99 lei
Preț vechi: 579.99 lei
-20%
Carte tipărită la comandă
Livrare economică 02-16 iunie
Specificații
ISBN-10: 111883481X
Pagini: 480
Dimensiuni: 174 x 251 x 30 mm
Greutate: 0.87 kg
Editura: Wiley
Locul publicării:Chichester, United Kingdom
Public țintă
Political and social scientists, industry analysts and data journalists as well as phD students of data mining and computational social science. GR, Tier 2De ce să citești această carte
Recomandăm această carte analiștilor și cercetătorilor care utilizează R și au nevoie de un flux de lucru automatizat pentru colectarea datelor web. Cititorul câștigă o înțelegere profundă a structurilor XML și JSON, precum și capacitatea de a implementa algoritmi de text mining pe date reale. Este un instrument practic indispensabil pentru transformarea web-ului într-o bază de date structurată și utilizabilă.