Reinforcement Learning
Autor Phil Winderen Limba Engleză Paperback – dec 2020
Destinată profesioniștilor din data science și inginerilor AI care doresc să depășească limitele algoritmilor tradiționali de învățare automată, această lucrare publicată de O'Reilly oferă un cadru aplicativ pentru unul dintre cele mai promițătoare subdomenii ale inteligenței artificiale. Descoperim în paginile scrise de Phil Winder o tranziție structurată de la conceptele de bază, precum procesele de decizie Markov și programarea dinamică, spre implementări complexe de Deep RL. Reținem că autorul nu se limitează la teorie, ci pune un accent deosebit pe integrarea acestor soluții în fluxuri de producție reale, un aspect critic pentru succesul proiectelor industriale. Abordarea diferă de The Art of Reinforcement Learning de Michael Hu prin orientarea sa pronunțată către mediul de business și scalabilitate — în timp ce volumul lui Hu se concentrează pe rigoarea teoretică și bazele matematice clasice, Reinforcement Learning explorează algoritmi de ultimă oră precum Rainbow, PPO sau TD3, esențiali pentru sisteme autonome moderne. Găsim aici o analiză a metodelor de policy gradient și a învățării ierarhice, elemente care permit agenților software să evolueze în medii dinamice fără constrângerile seturilor de date etichetate. Stilul este unul tehnic și dens, solicitând o înțelegere prealabilă a Machine Learning, însă recompensează cititorul prin exemple practice și o structură ce facilitează tranziția de la prototip la aplicație industrială.
Preț: 306.39 lei
Preț vechi: 382.99 lei
-20%
Carte disponibilă
Livrare economică 06-20 mai
Livrare express 22-28 aprilie pentru 66.81 lei
Specificații
ISBN-10: 1098114833
Pagini: 350
Dimensiuni: 183 x 233 x 25 mm
Greutate: 0.71 kg
Editura: O'Reilly
De ce să citești această carte
Pentru inginerii AI care vor să treacă de la modele predictive la sisteme capabile de decizii autonome în timp real. Veți câștiga competențe în implementarea algoritmilor de tip Deep RL și veți înțelege cum să gestionați desfășurarea acestora în producție, depășind etapa experimentelor de laborator prin studii de caz axate pe aplicații industriale concrete.
Descriere scurtă
Author Phil Winder of Winder Research covers everything from basic building blocks to state-of-the-art practices. You'll explore the current state of RL, focus on industrial applications, learn numerous algorithms, and benefit from dedicated chapters on deploying RL solutions to production. This is no cookbook; doesn't shy away from math and expects familiarity with ML.
- Learn what RL is and how the algorithms help solve problems
- Become grounded in RL fundamentals including Markov decision processes, dynamic programming, and temporal difference learning
- Dive deep into a range of value and policy gradient methods
- Apply advanced RL solutions such as meta learning, hierarchical learning, multi-agent, and imitation learning
- Understand cutting-edge deep RL algorithms including Rainbow, PPO, TD3, SAC, and more
- Get practical examples through the accompanying website