Cantitate/Preț
Produs

Robust Automatic Speech Recognition: A Bridge to Practical Applications

Autor Jinyu Li, Li Deng, Reinhold Haeb-Umbach, Yifan Gong
en Limba Engleză Hardback – 14 oct 2015

Apreciem în mod deosebit expertiza colectivului de autori condus de Jinyu Li și Li Deng, a căror activitate în organizații industriale de prestigiu și în mediul academic a modelat ecosistemul modern al procesării de limbaj. Robust Automatic Speech Recognition nu este doar un tratat teoretic, ci o punte pragmatică spre aplicații reale, fiind prima lucrare care oferă o revizuire cuprinzătoare a metodelor de recunoaștere vocală în era rețelelor neuronale profunde.

Pe linia practică a volumului New Era for Robust Speech Recognition, dar cu un focus distinct pe tratamentul matematic riguros al distorsiunilor acustice, această lucrare analizează critic tehnologiile de ultimă oră. Apreciem structura logică a volumului, care ghidează cititorul prin fundamentele recunoașterii vocale înainte de a trece la tehnici complexe precum procesarea în domeniul trăsăturilor și al modelelor, compensarea cu cunoștințe a priori și procesarea incertitudinii. Un punct forte este capitolul dedicat procesării multi-canal, esențial pentru dezvoltarea dispozitivelor hardware moderne.

Spre deosebire de Techniques for Noise Robustness in Automatic Speech Recognition, care explorează mediile zgomotoase cotidiene, volumul de față oferă un cadru de categorisire mai formal, ajutând inginerii să selecteze cele mai bune metode pentru scenarii specifice de reverberație și zgomot ambiental. Conținutul este organizat pentru a facilita progresia de la modelele clasice la cele bazate pe deep learning, asigurând o înțelegere sistemică a modului în care pot fi construite sisteme ASR (Automatic Speech Recognition) cu adevărat fiabile.

Citește tot Restrânge

Preț: 60758 lei

Preț vechi: 83248 lei
-27%

Puncte Express: 911

Carte tipărită la comandă

Livrare economică 15-29 mai


Specificații

ISBN-13: 9780128023983
ISBN-10: 0128023988
Pagini: 306
Dimensiuni: 191 x 235 x 18 mm
Greutate: 0.79 kg
Editura: ELSEVIER SCIENCE

Public țintă

Researchers and engineers in the area of speech processing, both in industry and academia; Undergraduate and graduate students in the area of signal and speech processing.

De ce să citești această carte

Recomandăm această carte inginerilor și cercetătorilor care au nevoie de soluții concrete pentru eliminarea distorsiunilor acustice în sistemele de recunoaștere vocală. Veți câștiga o metodologie clară pentru selectarea algoritmilor potriviți în funcție de mediul de utilizare, beneficiind de expertiza unor autori care au implementat aceste tehnologii la scară industrială. Este un instrument esențial pentru tranziția de la modelele statistice clasice la arhitecturile deep learning.


Descriere scurtă

Robust Automatic Speech Recognition: A Bridge to Practical Applications establishes a solid foundation for automatic speech recognition that is robust against acoustic environmental distortion. It provides a thorough overview of classical and modern noise-and reverberation robust techniques that have been developed over the past thirty years, with an emphasis on practical methods that have been proven to be successful and which are likely to be further developed for future applications.The strengths and weaknesses of robustness-enhancing speech recognition techniques are carefully analyzed. The book covers noise-robust techniques designed for acoustic models which are based on both Gaussian mixture models and deep neural networks. In addition, a guide to selecting the best methods for practical applications is provided.The reader will:
  • Gain a unified, deep and systematic understanding of the state-of-the-art technologies for robust speech recognition
  • Learn the links and relationship between alternative technologies for robust speech recognition
  • Be able to use the technology analysis and categorization detailed in the book to guide future technology development
  • Be able to develop new noise-robust methods in the current era of deep learning for acoustic modeling in speech recognition


  • The first book that provides a comprehensive review on noise and reverberation robust speech recognition methods in the era of deep neural networks
  • Connects robust speech recognition techniques to machine learning paradigms with rigorous mathematical treatment
  • Provides elegant and structural ways to categorize and analyze noise-robust speech recognition techniques
  • Written by leading researchers who have been actively working on the subject matter in both industrial and academic organizations for many years

Cuprins

  1. Introduction
  2. Fundamental of speech recognition
  3. Background of robust speech recognition
  4. Processing in the Feature and Model Domains
  5. Compensation with prior knowledge
  6. Explicit distortion modeling
  7. Uncertainty processing
  8. Joint model training
  9. Reverberant speech recognition
  10. Multi-channel processing
  11. Summary and Future Directions