Cantitate/Preț
Produs

Introduction to Information Retrieval: Recomandări cărți Ecommerce - Școala de vară GPeC 2019

Autor Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze
en Limba Engleză Hardback – sep 2008

În domeniul procesării datelor și al motoarelor de căutare, Introduction to Information Retrieval reprezintă un fundament tehnic esențial pentru înțelegerea modului în care informația este stocată, indexată și regăsită. Apreciem coerența cu care autorii Christopher D. Manning, Prabhakar Raghavan și Hinrich Schütze transformă concepte complexe în soluții aplicabile, trecând de la structurile de bază ale listelor de postări (postings lists) la algoritmi avansați de clasificare și clustering. Pe linia practică a lucrării Modern Information Retrieval de Ricardo Baeza-Yates, acest volum se distinge prin focusul specific pe integrarea metodelor statistice și a învățării automate în contextul web-ului modern. Structura progresivă a cărții facilitează o învățare riguroasă: primele capitole sunt dedicate fundamentelor indexării și compresiei, urmate de modele vectoriale și probabilistice, culminând cu tehnici specifice pentru web search, precum link analysis și crawling. Subliniem faptul că, spre deosebire de lucrarea anterioară a lui Christopher D. Manning, Complex Predicates and Information Spreading in LFG, care se concentra pe structuri lingvistice formale, volumul de față adoptă o perspectivă computațională și statistică asupra limbajului natural. Cele 21 de capitole sunt susținute de 263 de exerciții care permit verificarea imediată a înțelegerii algoritmilor de tip Naive Bayes sau Support Vector Machines. Este o resursă indispensabilă pentru inginerii care proiectează sisteme de căutare scalabile, oferind nu doar teorie, ci și modele de evaluare a preciziei și rapelului (recall) în sisteme reale de producție.

Citește tot Restrânge

Din seria Recomandări cărți Ecommerce - Școala de vară GPeC 2019

Preț: 41433 lei

Preț vechi: 51791 lei
-20%

Puncte Express: 621

Carte disponibilă

Livrare economică 06-20 mai
Livrare express 21-25 aprilie pentru 54100 lei


Specificații

ISBN-13: 9780521865715
ISBN-10: 0521865719
Pagini: 506
Ilustrații: 5 halftones, 47 tables, 263 exercises
Dimensiuni: 183 x 260 x 32 mm
Greutate: 1.14 kg
Ediția:Anniversary
Editura: Cambridge University Pr.
Seria Recomandări cărți Ecommerce - Școala de vară GPeC 2019

Locul publicării:New York, United States

De ce să citești această carte

Recomandăm această carte inginerilor software și cercetătorilor care doresc să stăpânească arhitectura motoarelor de căutare. Cititorul câștigă o înțelegere profundă a tehnicilor de indexare, clasificare și machine learning aplicate pe text. Este un ghid practic care transformă teoria regăsirii informației în specificații concrete pentru implementarea sistemelor de web search, fiind un titlu de referință în bibliografia specialiștilor în eCommerce și Big Data.


Despre autor

Christopher D. Manning este profesor de informatică și lingvistică la Universitatea Stanford, fiind o figură centrală în domeniul procesării limbajului natural (NLP). Cercetările sale se concentrează pe modele probabilistice, extracția de informații și text mining. Experiența sa academică și practică se reflectă în rigoarea acestui volum, Manning fiind recunoscut pentru capacitatea de a îmbina lingvistica teoretică cu metodele statistice avansate. Lucrările sale sunt fundamentale pentru dezvoltarea tehnologiilor actuale de înțelegere a textului și căutare semantică.


Descriere scurtă

Class-tested and coherent, this textbook teaches classical and web information retrieval, including web search and the related areas of text classification and text clustering from basic concepts. It gives an up-to-date treatment of all aspects of the design and implementation of systems for gathering, indexing, and searching documents; methods for evaluating systems; and an introduction to the use of machine learning methods on text collections. All the important ideas are explained using examples and figures, making it perfect for introductory courses in information retrieval for advanced undergraduates and graduate students in computer science. Based on feedback from extensive classroom experience, the book has been carefully structured in order to make teaching more natural and effective. Slides and additional exercises (with solutions for lecturers) are also available through the book's supporting website to help course instructors prepare their lectures.

Cuprins

1. Information retrieval using the Boolean model; 2. The dictionary and postings lists; 3. Tolerant retrieval; 4. Index construction; 5. Index compression; 6. Scoring and term weighting; 7. Vector space retrieval; 8. Evaluation in information retrieval; 9. Relevance feedback and query expansion; 10. XML retrieval; 11. Probabilistic information retrieval; 12. Language models for information retrieval; 13. Text classification and Naive Bayes; 14. Vector space classification; 15. Support vector machines and kernel functions; 16. Flat clustering; 17. Hierarchical clustering; 18. Dimensionality reduction and latent semantic indexing; 19. Web search basics; 20. Web crawling and indexes; 21. Link analysis.

Recenzii

'This is the first book that gives you a complete picture of the complications that arise in building a modern web-scale search engine. You'll learn about ranking SVMs, XML, DNS, and LSI. You'll discover the seedy underworld of spam, cloaking, and doorway pages. You'll see how MapReduce and other approaches to parallelism allow us to go beyond megabytes and to efficiently manage petabytes.' Peter Norvig, Director of Research, Google Inc.
'… this book sets a high standard …' Natural Language Engineering
'Introduction to Information Retrieval is a comprehensive, authoritative, and well-written overview of the main topics in IR. The book offers a good balance of theory and practice, and is an excellent self-contained introductory text for those new to IR.' Computational Linguistics
'This book provides what Salton and Van Rijsbergen both failed to achieve … Even more important, unlike some other books in IR, the authors appear to care about making the theory as accessible as possible to the reader, on occasion including short primers to certain topics or choosing to explain difficult concepts using simplified approaches. … its coverage [is] excellent, the quality of writing high and I was surprised how much I learned from reading it. I think the online resources are impressive.' Natural Language Engineering