# John Schulman **Ruolo:** Co-Founder & Chief Scientist @ [[Thinking Machines Lab]] **Ex Ruolo:** Co-Founder @ [[OpenAI]] **Stato:** Il Maestro del Reinforcement Learning 🧠 ## Contesto Una delle menti più brillanti dietro ChatGPT. Ha inventato **RLHF** (Reinforcement Learning from Human Feedback), la tecnica che ha reso ChatGPT "utile e sicuro" invece che solo "intelligente". Dopo anni in [[OpenAI]], è uscito per fondare [[Thinking Machines Lab]] con [[Mira Murati]], deluso dalla deriva commerciale di [[Sam Altman]]. ## Contributi Chiave - **RLHF:** La tecnica che ha reso ChatGPT conversazionale - **PPO Algorithm:** Proximal Policy Optimization (standard nel RL) - **ChatGPT:** Architetto tecnico del sistema ## Relazioni - **Ex Alleato:** [[Sam Altman]], [[Greg Brockman]], [[Ilya Sutskever]] (fondatori OpenAI) - **Nuovo Team:** [[Mira Murati]] (CEO Thinking Machines Lab) - **Filosofia:** Allineato con [[Ilya Sutskever]] e [[Dario Amodei]] sulla necessità di sicurezza ## Focus Creare modelli che "pensano" meglio invece che solo memorizzare pattern. Qualità del ragionamento > dimensione del modello.