Cantitate/Preț
Produs

Automated Data Collection with R

Autor Simon Munzert, Christian Rubba, Peter Meißner, Dominic Nyhuis
en Limba Engleză Hardback – 20 ian 2015

În domeniul data mining și al analizei computaționale, capacitatea de a extrage informații brute și de a le transforma în seturi de date structurate reprezintă o competență critică. Automated Data Collection with R oferă un ghid aplicat, orientat spre practică, pentru utilizatorii limbajului R care doresc să stăpânească procesele de web scraping și text mining. Notăm cu interes modul în care autorii, Simon Munzert și echipa sa, reușesc să demistifice arhitectura web-ului, oferind explicații tehnice riguroase pentru protocoalele HTTP și formatele de date precum HTML, XML sau JSON. Putem afirma că volumul se distinge prin abordarea sa holistică: nu se limitează doar la extragerea datelor, ci explorează și managementul textului prin tehnici avansate de analiză supervizată și nesupervizată. Cititorul care a aplicat deja conceptele fundamentale din XML and Web Technologies for Data Sciences with R de Deborah Nolan va găsi aici o continuare firească, centrată pe automatizarea fluxurilor de lucru și pe utilizarea eficientă a XPath și a expresiilor regulate pentru interogarea documentelor web complexe. Structura cărții este solid ancorată în realitate, fiecare capitol fiind susținut de studii de caz și exerciții care permit testarea imediată a codului R furnizat. Spre deosebire de alte introduceri în domeniu, acest manual publicat de Wiley face trecerea de la simpla colectare la prelucrarea datelor pentru baze de date SQL, oferind instrumentele necesare pentru a gestiona volume mari de informații neevaluate. Este o resursă tehnică esențială pentru cei care au nevoie de date proaspete din mediul online pentru cercetări academice sau analize de piață.

Citește tot Restrânge

Preț: 47244 lei

Preț vechi: 59055 lei
-20%

Puncte Express: 709

Carte tipărită la comandă

Livrare economică 20 iulie-03 august

Livrare prin curier în România Termenul estimat este afișat lângă disponibilitate.
Transport gratuit pentru acest produs Plată online sau ramburs, în funcție de opțiunile comenzii.
Retur gratuit în 14 zile Comandă securizată și suport în română.

Specificații

ISBN-13: 9781118834817
ISBN-10: 111883481X
Pagini: 480
Dimensiuni: 174 x 251 x 30 mm
Greutate: 0.87 kg
Editura: Wiley
Locul publicării:Chichester, United Kingdom

Public țintă

Political and social scientists, industry analysts and data journalists as well as phD students of data mining and computational social science. GR, Tier 2

De ce să citești această carte

Recomandăm această carte analiștilor și cercetătorilor care utilizează R și au nevoie de un flux de lucru automatizat pentru colectarea datelor web. Cititorul câștigă o înțelegere profundă a structurilor XML și JSON, precum și capacitatea de a implementa algoritmi de text mining pe date reale. Este un instrument practic indispensabil pentru transformarea web-ului într-o bază de date structurată și utilizabilă.


Descriere scurtă

A hands on guide to web scraping and text mining for both beginners and experienced users of R * Introduces fundamental concepts of the main architecture of the web and databases and covers HTTP, HTML, XML, JSON, SQL. * Provides basic techniques to query web documents and data sets (XPath and regular expressions). * An extensive set of exercises are presented to guide the reader through each technique. * Explores both supervised and unsupervised techniques as well as advanced techniques such as data scraping and text management. * Case studies are featured throughout along with examples for each technique presented. * R code and solutions to exercises featured in the book are provided on a supporting website.