Cantitate/Preț
Produs

Automated Data Collection with R

Autor Simon Munzert, Christian Rubba, Peter Meißner, Dominic Nyhuis
en Limba Engleză Hardback – 20 ian 2015

În domeniul data mining și al analizei computaționale, capacitatea de a extrage informații brute și de a le transforma în seturi de date structurate reprezintă o competență critică. Automated Data Collection with R oferă un ghid aplicat, orientat spre practică, pentru utilizatorii limbajului R care doresc să stăpânească procesele de web scraping și text mining. Notăm cu interes modul în care autorii, Simon Munzert și echipa sa, reușesc să demistifice arhitectura web-ului, oferind explicații tehnice riguroase pentru protocoalele HTTP și formatele de date precum HTML, XML sau JSON. Putem afirma că volumul se distinge prin abordarea sa holistică: nu se limitează doar la extragerea datelor, ci explorează și managementul textului prin tehnici avansate de analiză supervizată și nesupervizată. Cititorul care a aplicat deja conceptele fundamentale din XML and Web Technologies for Data Sciences with R de Deborah Nolan va găsi aici o continuare firească, centrată pe automatizarea fluxurilor de lucru și pe utilizarea eficientă a XPath și a expresiilor regulate pentru interogarea documentelor web complexe. Structura cărții este solid ancorată în realitate, fiecare capitol fiind susținut de studii de caz și exerciții care permit testarea imediată a codului R furnizat. Spre deosebire de alte introduceri în domeniu, acest manual publicat de Wiley face trecerea de la simpla colectare la prelucrarea datelor pentru baze de date SQL, oferind instrumentele necesare pentru a gestiona volume mari de informații neevaluate. Este o resursă tehnică esențială pentru cei care au nevoie de date proaspete din mediul online pentru cercetări academice sau analize de piață.

Citește tot Restrânge

Preț: 46399 lei

Preț vechi: 57999 lei
-20%

Puncte Express: 696

Carte tipărită la comandă

Livrare economică 02-16 iunie


Specificații

ISBN-13: 9781118834817
ISBN-10: 111883481X
Pagini: 480
Dimensiuni: 174 x 251 x 30 mm
Greutate: 0.87 kg
Editura: Wiley
Locul publicării:Chichester, United Kingdom

Public țintă

Political and social scientists, industry analysts and data journalists as well as phD students of data mining and computational social science. GR, Tier 2

De ce să citești această carte

Recomandăm această carte analiștilor și cercetătorilor care utilizează R și au nevoie de un flux de lucru automatizat pentru colectarea datelor web. Cititorul câștigă o înțelegere profundă a structurilor XML și JSON, precum și capacitatea de a implementa algoritmi de text mining pe date reale. Este un instrument practic indispensabil pentru transformarea web-ului într-o bază de date structurată și utilizabilă.


Descriere scurtă

A hands on guide to web scraping and text mining for both beginners and experienced users of R * Introduces fundamental concepts of the main architecture of the web and databases and covers HTTP, HTML, XML, JSON, SQL. * Provides basic techniques to query web documents and data sets (XPath and regular expressions). * An extensive set of exercises are presented to guide the reader through each technique. * Explores both supervised and unsupervised techniques as well as advanced techniques such as data scraping and text management. * Case studies are featured throughout along with examples for each technique presented. * R code and solutions to exercises featured in the book are provided on a supporting website.