# John Schulman

**Ruolo:** Co-Founder & Chief Scientist @ [[Thinking Machines Lab]]
**Ex Ruolo:** Co-Founder @ [[OpenAI]]
**Stato:** Il Maestro del Reinforcement Learning 🧠

## Contesto
Una delle menti più brillanti dietro ChatGPT. Ha inventato **RLHF** (Reinforcement Learning from Human Feedback), la tecnica che ha reso ChatGPT "utile e sicuro" invece che solo "intelligente". Dopo anni in [[OpenAI]], è uscito per fondare [[Thinking Machines Lab]] con [[Mira Murati]], deluso dalla deriva commerciale di [[Sam Altman]].

## Contributi Chiave
- **RLHF:** La tecnica che ha reso ChatGPT conversazionale
- **PPO Algorithm:** Proximal Policy Optimization (standard nel RL)
- **ChatGPT:** Architetto tecnico del sistema

## Relazioni
- **Ex Alleato:** [[Sam Altman]], [[Greg Brockman]], [[Ilya Sutskever]] (fondatori OpenAI)
- **Nuovo Team:** [[Mira Murati]] (CEO Thinking Machines Lab)
- **Filosofia:** Allineato con [[Ilya Sutskever]] e [[Dario Amodei]] sulla necessità di sicurezza

## Focus
Creare modelli che "pensano" meglio invece che solo memorizzare pattern. Qualità del ragionamento > dimensione del modello.