Robust Automatic Speech Recognition: A Bridge to Practical Applications
Autor Jinyu Li, Li Deng, Reinhold Haeb-Umbach, Yifan Gongen Limba Engleză Hardback – 14 oct 2015
Apreciem în mod deosebit expertiza colectivului de autori condus de Jinyu Li și Li Deng, a căror activitate în organizații industriale de prestigiu și în mediul academic a modelat ecosistemul modern al procesării de limbaj. Robust Automatic Speech Recognition nu este doar un tratat teoretic, ci o punte pragmatică spre aplicații reale, fiind prima lucrare care oferă o revizuire cuprinzătoare a metodelor de recunoaștere vocală în era rețelelor neuronale profunde.
Pe linia practică a volumului New Era for Robust Speech Recognition, dar cu un focus distinct pe tratamentul matematic riguros al distorsiunilor acustice, această lucrare analizează critic tehnologiile de ultimă oră. Apreciem structura logică a volumului, care ghidează cititorul prin fundamentele recunoașterii vocale înainte de a trece la tehnici complexe precum procesarea în domeniul trăsăturilor și al modelelor, compensarea cu cunoștințe a priori și procesarea incertitudinii. Un punct forte este capitolul dedicat procesării multi-canal, esențial pentru dezvoltarea dispozitivelor hardware moderne.
Spre deosebire de Techniques for Noise Robustness in Automatic Speech Recognition, care explorează mediile zgomotoase cotidiene, volumul de față oferă un cadru de categorisire mai formal, ajutând inginerii să selecteze cele mai bune metode pentru scenarii specifice de reverberație și zgomot ambiental. Conținutul este organizat pentru a facilita progresia de la modelele clasice la cele bazate pe deep learning, asigurând o înțelegere sistemică a modului în care pot fi construite sisteme ASR (Automatic Speech Recognition) cu adevărat fiabile.
Preț: 607.58 lei
Preț vechi: 832.48 lei
-27%
Carte tipărită la comandă
Livrare economică 15-29 mai
Specificații
ISBN-10: 0128023988
Pagini: 306
Dimensiuni: 191 x 235 x 18 mm
Greutate: 0.79 kg
Editura: ELSEVIER SCIENCE
Public țintă
Researchers and engineers in the area of speech processing, both in industry and academia; Undergraduate and graduate students in the area of signal and speech processing.De ce să citești această carte
Recomandăm această carte inginerilor și cercetătorilor care au nevoie de soluții concrete pentru eliminarea distorsiunilor acustice în sistemele de recunoaștere vocală. Veți câștiga o metodologie clară pentru selectarea algoritmilor potriviți în funcție de mediul de utilizare, beneficiind de expertiza unor autori care au implementat aceste tehnologii la scară industrială. Este un instrument esențial pentru tranziția de la modelele statistice clasice la arhitecturile deep learning.
Descriere scurtă
- Gain a unified, deep and systematic understanding of the state-of-the-art technologies for robust speech recognition
- Learn the links and relationship between alternative technologies for robust speech recognition
- Be able to use the technology analysis and categorization detailed in the book to guide future technology development
- Be able to develop new noise-robust methods in the current era of deep learning for acoustic modeling in speech recognition
- The first book that provides a comprehensive review on noise and reverberation robust speech recognition methods in the era of deep neural networks
- Connects robust speech recognition techniques to machine learning paradigms with rigorous mathematical treatment
- Provides elegant and structural ways to categorize and analyze noise-robust speech recognition techniques
- Written by leading researchers who have been actively working on the subject matter in both industrial and academic organizations for many years
Cuprins
- Introduction
- Fundamental of speech recognition
- Background of robust speech recognition
- Processing in the Feature and Model Domains
- Compensation with prior knowledge
- Explicit distortion modeling
- Uncertainty processing
- Joint model training
- Reverberant speech recognition
- Multi-channel processing
- Summary and Future Directions