Algorithms for Decision Making
Autor Mykel J. Kochenderfer, Tim A. Wheeleren Limba Engleză Hardback – 16 aug 2022
Ceea ce diferențiază volumul Algorithms for Decision Making de documentația oficială a diverselor biblioteci de calcul este abordarea integrată, care nu se rezumă la sintaxă, ci construiește o bază matematică solidă pentru sistemele de suport decizional. Remarcăm o tranziție riguroasă de la simpla reprezentare a datelor la execuția unor politici complexe în medii cu un grad ridicat de incertitudine. Lucrarea este organizată în cinci părți distincte, începând cu raționamentul probabilistic (capitolele 2-6) și avansând către probleme secvențiale, unde apar metodele de soluționare exactă și optimizarea gradientului de politică. Pe linia practică a volumului Reinforcement Learning and Stochastic Optimization, dar cu focus pe implementarea algoritmică explicită în limbajul Julia, autorii reușesc să transforme teoria abstractă în instrumente aplicabile. În contextul operei lui Mykel J. Kochenderfer, această carte reprezintă o evoluție naturală și o extindere a temelor abordate în Algorithms for Optimization. Dacă lucrarea anterioară se concentra pe spații de căutare și constrângeri inginerești, volumul de față adâncește problematica incertitudinii stării și a sistemelor multi-agent (Partea V), oferind algoritmi pentru medii în care agenții trebuie să colaboreze sau să concureze. Structura progresivă a cuprinsului indică o acoperire exhaustivă: de la învățarea parametrilor și a structurii, la metode model-free și imitarea învățării (Partea III). Credem că includerea metodelor de tip Actor-Critic și a tehnicilor de validare a politicilor oferă inginerilor un cadru complet pentru dezvoltarea sistemelor autonome critice, precum cele din aviație sau medicină, unde echilibrarea mai multor obiective este vitală.
Preț: 606.53 lei
Preț vechi: 780.98 lei
-22%
Carte disponibilă
Livrare economică 25 mai-01 iunie
Livrare express 08-14 mai pentru 82.98 lei
Specificații
ISBN-10: 0262047012
Pagini: 704
Dimensiuni: 207 x 233 x 38 mm
Greutate: 1.24 kg
Editura: MIT Press Ltd
De ce să citești această carte
Recomandăm această carte profesioniștilor din inteligență artificială și cercetătorilor care au nevoie de o punte între formulările matematice și implementarea software. Cititorul câștigă o înțelegere profundă a modului în care sistemele pot lua decizii optime în condiții de informații imperfecte. Este un instrument tehnic esențial pentru oricine dorește să stăpânească algoritmii de planificare și reinforcement learning folosind eficiența limbajului Julia.
Despre autor
Mykel J. Kochenderfer este profesor asistent în cadrul Departamentului de Aeronautică și Astronautică la Universitatea Stanford, fiind totodată consultant pentru MIT Lincoln Laboratory. Expertiza sa se concentrează pe sistemele de evitare a coliziunilor și pe optimizarea deciziilor în medii nesigure. Alături de Tim A. Wheeler, acesta a dezvoltat un stil didactic ce îmbină rigoarea academică cu aplicabilitatea industrială, contribuind semnificativ la literatura de specialitate prin lucrări fundamentale publicate la MIT Press Ltd.
Notă biografică
Descriere scurtă
Automated decision-making systems or decision-support systems-used in applications that range from aircraft collision avoidance to breast cancer screening-must be designed to account for various sources of uncertainty while carefully balancing multiple objectives. This textbook provides a broad introduction to algorithms for decision making under uncertainty, covering the underlying mathematical problem formulations and the algorithms for solving them.
The book first addresses the problem of reasoning about uncertainty and objectives in simple decisions at a single point in time, and then turns to sequential decision problems in stochastic environments where the outcomes of our actions are uncertain. It goes on to address model uncertainty, when we do not start with a known model and must learn how to act through interaction with the environment; state uncertainty, in which we do not know the current state of the environment due to imperfect perceptual information; and decision contexts involving multiple agents. The book focuses primarily on planning and reinforcement learning, although some of the techniques presented draw on elements of supervised learning and optimization. Algorithms are implemented in the Julia programming language. Figures, examples, and exercises convey the intuition behind the various approaches presented.
Cuprins
Acknowledgments xxi
1 Introduction 1
Part I Probabilistic Reasoning
2 Representation 19
3 Inference 43
4 Parameter Learning 71
5 Structure Learning 97
6 Simple Decisions 111
Part II Sequential Problems
7 Exact Solution Methods 133
8 Approximate Value Functions 161
9 Online Planning 181
10 Policy Search 213
11 Policy Gradient Estimation 231
12 Policy Gradient Optimization 249
13 Actor-Critic Methods 267
14 Policy Validation 281
Part III Model Uncertainty
15 Exploration and Exploitation 299
16 Model-Based Methods 317
17 Model-Free Methods 335
18 Imitation Learning 335
Part IV State Uncertainty
19 Beliefs 379
20 Exact Belief State Planning 407
21 Offline Belief State Planning 427
22 Online Belief State Planning 453
23 Controller Abstractions 471
Part V Multiagent Systems
24 Multiagent Reasoning 493
25 Sequential Problems 517
26 State Uncertainty 533
27 Collaborative Agents 545
Appendices
A Mathematical Concepts 561
B Probability Distributions 573
C Computational Complexity 575
D Neural Representations 581
E Search Algorithms 599
F Problems 609
G Julia 627
References 651
Index 671