Cantitate/Preț
Produs

Applied Text Analysis with Python

Autor Benjamin Bengfort, Rebecca Bilbro, Tony Ojeda
en Limba Engleză Paperback – 30 iun 2018

Problema fundamentală în analiza datelor moderne nu este lipsa informației, ci incapacitatea de a extrage structură din fluxul constant și adaptabil al limbajului natural. În Applied Text Analysis with Python, autorii propun o metodologie riguroasă pentru transformarea textului brut în reprezentări vectoriale multidimensionale, facilitând astfel integrarea acestuia în produse software performante. Remarcăm o abordare pragmatică, orientată spre ingineria de trăsături lingvistice și scalabilitate, oferind soluții concrete pentru clasificarea documentelor și modelarea pe subiecte. Subliniem faptul că volumul nu se limitează la teorie, ci ghidează cititorul prin procese complexe precum rezoluția entităților și analiza de grafuri pentru a deduce relații între datele textuale. Un aspect distinctiv față de alte resurse tehnice este utilizarea diagnosticării vizuale pentru a ghida selecția modelelor, asigurând astfel o înțelegere profundă a modului în care algoritmii interacționează cu datele. Cititorul care a aplicat ideile din Applied Natural Language Processing with Python de Taweh Beysolow Ii va găsi aici o extensie necesară către zona de producție, explorând cum Spark și rețelele neuronale pot fi folosite pentru a gestiona volume masive de date. De asemenea, spre deosebire de Text Analytics with Python de Dipanjan Sarkar, care pune accent pe mediul de lucru și studii de caz, lucrarea de față se concentrează pe construirea de framework-uri de dialog și sisteme capabile să susțină interacțiuni complexe prin chatbot-uri.

Citește tot Restrânge

Preț: 32862 lei

Preț vechi: 41077 lei
-20%

Puncte Express: 493

Carte disponibilă

Livrare economică 29 aprilie-13 mai
Livrare express 15-21 aprilie pentru 3788 lei


Specificații

ISBN-13: 9781491963043
ISBN-10: 1491963042
Pagini: 350
Dimensiuni: 177 x 233 x 25 mm
Greutate: 0.58 kg
Ediția:1
Editura: O'Reilly

De ce să citești această carte

Recomandăm această carte inginerilor de date și cercetătorilor care doresc să treacă de la simple scripturi de procesare la sisteme de analiză a textului scalabile în producție. Cititorul câștigă competențe în vectorizarea avansată și utilizarea instrumentelor precum Spark, esențiale pentru procesarea seturilor mari de date. Este un ghid tehnic indispensabil pentru dezvoltarea unor aplicații moderne capabile să „înțeleagă” și să interacționeze inteligent cu utilizatorii prin limbaj natural.


Despre autor

Benjamin Bengfort, Rebecca Bilbro și Tony Ojeda sunt experți recunoscuți în ecosistemul Python și știința datelor, având o experiență vastă în implementarea soluțiilor de machine learning la nivel industrial. Benjamin Bengfort este cunoscut pentru contribuțiile sale în domeniul sistemelor distribuite și analizei datelor, în timp ce Rebecca Bilbro este co-creatoarea bibliotecii Yellowbrick, specializată în vizualizarea și diagnosticarea modelelor de machine learning. Împreună cu Tony Ojeda, fondator al District Data Labs, aceștia aduc o perspectivă multidisciplinară asupra modului în care analiza textului poate fi transformată dintr-o provocare academică într-un activ tehnologic valoros pentru orice organizație.


Notă biografică

Benjamin Bengfort is a Data Scientist who lives inside the beltway but ignores politics (the normal business of DC) favoring technology instead. He is currently working to finish his PhD at the University of Maryland where he studies machine learning and distributed computing. His lab does have robots (though this field of study is not one he favors) and, much to his chagrin, they seem to constantly arm said robots with knives and tools; presumably to pursue culinary accolades. Having seen a robot attempt to slice a tomato, Benjamin prefers his own adventures in the kitchen where he specializes in fusion French and Guyanese cuisine as well as BBQ of all types. A professional programmer by trade, a Data Scientist by vocation, Benjamin's writing pursues a diverse range of subjects from Natural Language Processing, to Data Science with Python to analytics with Hadoop and Spark.
Dr. Rebecca Bilbro is a data scientist, Python programmer, and author in Washington, DC. She specializes in data visualization for machine learning, from feature analysis to model selection and hyperparameter tuning. She is an active contributor to the open source community and has conducted research on natural language processing, semantic network extraction, entity resolution, and high dimensional information visualization. She earned her doctorate from the University of Illinois, Urbana-Champaign, where her research centered on communication and visualization practices in engineering.
Tony is the founder of District Data Labs and focuses on applied analytics for business strategy. He has published a book on practical data science, and has experience with hands-on education and data science curricula.

Descriere

From news and speeches to informal chatter on social media, natural language is one of the richest and most underutilized sources of data. Not only does it come in a constant stream, always changing and adapting in context; it also contains information that is not conveyed by traditional data sources. The key to unlocking natural language is through the creative application of text analytics. This practical book presents a data scientist's approach to building language-aware products with applied machine learning. You'll learn robust, repeatable, and scalable techniques for text analysis with Python, including contextual and linguistic feature engineering, vectorization, classification, topic modeling, entity resolution, graph analysis, and visual steering. By the end of the book, you'll be equipped with practical methods to solve any number of complex real-world problems. Preprocess and vectorize text into high-dimensional feature representations Perform document classification and topic modeling Steer the model selection process with visual diagnostics Extract key phrases, named entities, and graph structures to reason about data in text Build a dialog framework to enable chatbots and language-driven interaction Use Spark to scale processing power and neural networks to scale model complexity