Reinforcement Learning from Human Feedback Autor Nathan Lambert 28 iul 2026 Paperback Preț: 360.42 lei 450.53 lei Nepublicat încă -20% Precomandă