Reinforcement Learning: Adaptive Computation and Machine Learning series
Autor Richard S. Sutton, Andrew G. Barto Editat de Francis Bachen Limba Engleză Hardback – 13 noi 2018
Prin parcurgerea acestui volum de referință, cititorul va implementa algoritmi capabili să maximizeze recompensele într-un mediu complex și incert, trecând de la fundamentele teoretice la arhitecturi de inteligență artificială aplicate. Observăm că Richard S. Sutton și Andrew G. Barto au structurat această a doua ediție a Reinforcement Learning ca pe un manual progresiv, eliminând barierele dintre cercetarea academică și ingineria practică. Prima parte a lucrării epuizează cazul tabular, oferind soluții exacte pentru probleme fundamentale prin algoritmi precum UCB sau Double Learning, în timp ce a doua parte extinde aceste concepte către aproximarea funcțiilor, utilizând rețele neuronale artificiale și baza Fourier. Cititorul care a aplicat ideile introductive din The Art of Reinforcement Learning va găsi aici rigoarea necesară pentru a trece la metode de gradient de politică (policy-gradient) și la învățarea off-policy. Stilul este unul tehnic și pragmatic; deși fundamentul matematic este solid, autorii au ales să izoleze demonstrațiile dense în casete separate pentru a nu fragmenta logica implementării. Suntem de părere că includerea studiilor de caz moderne, precum mecanismele din spatele AlphaGo Zero și jocurile Atari, transformă conceptele abstracte în repere concrete de performanță. Volumul nu se rezumă doar la cod și matematică, dedicând capitole noi relației dintre învățarea prin recompensă, psihologie și neuroștiințe, oferind astfel o viziune sistemică asupra modului în care agenții artificiali pot replica procese cognitive complexe.
Preț: 639.65 lei
Preț vechi: 908.04 lei
-30%
Carte disponibilă
Livrare economică 04-11 mai
Livrare express 17-23 aprilie pentru 81.92 lei
Specificații
ISBN-10: 0262039249
Pagini: 552
Ilustrații: 64 color illus., 51 b 115 Illustrations, unspecified
Dimensiuni: 185 x 230 x 40 mm
Greutate: 1.3 kg
Ediția:2. Auflage
Editura: The MIT Press
Seria Adaptive Computation and Machine Learning series
De ce să citești această carte
Această carte este considerată „biblia” domeniului, fiind esențială pentru inginerii de date și cercetătorii în IA care vor să stăpânească mecanismele de învățare autonomă. Veți câștiga o înțelegere profundă a algoritmilor care stau la baza celor mai mari succese din tech, de la AlphaGo la sisteme de control industrial. Este resursa definitivă pentru a trece de la simpla utilizare a bibliotecilor software la proiectarea propriilor arhitecturi de învățare prin recompensă.
Despre autor
Richard S. Sutton este cercetător principal în cadrul Departamentului de Informatică al Universității din Massachusetts și este recunoscut la nivel mondial ca unul dintre fondatorii domeniului învățării prin recompensă (reinforcement learning). Alături de Andrew G. Barto, a definit limbajul și conceptele de bază care guvernează astăzi interacțiunea dintre agenții inteligenți și mediile lor. Contribuțiile sale în cadrul seriei Adaptive Computation and Machine Learning series de la The MIT Press au influențat generații de cercetători, munca sa fiind la intersecția dintre informatică, neuroștiințe și inteligență artificială.
Notă biografică
Andrew G. Barto is Professor Emeritus in the College of Computer and Information Sciences at the University of Massachusetts Amherst.
Descriere scurtă
Like the first edition, this second edition focuses on core online learning algorithms, with the more mathematical material set off in shaded boxes. Part I covers as much of reinforcement learning as possible without going beyond the tabular case for which exact solutions can be found. Many algorithms presented in this part are new to the second edition, including UCB, Expected Sarsa, and Double Learning. Part II extends these ideas to function approximation, with new sections on such topics as artificial neural networks and the Fourier basis, and offers expanded treatment of off-policy learning and policy-gradient methods. Part III has new chapters on reinforcement learning's relationships to psychology and neuroscience, as well as an updated case-studies chapter including AlphaGo and AlphaGo Zero, Atari game playing, and IBM Watson's wagering strategy. The final chapter discusses the future societal impacts of reinforcement learning.