Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 9 - Recap & Current Trends | Stanford Online

This lecture, the last of the CME 295 course, recaps the quarter's material, previews trending topics, and offers closing thoughts. The lecture begins by reviewing transformers, tokenization, embeddings (Word2Vec, RNNs), and self-attention mechanisms. It then moves to improvements on the transformer architecture, including positional embeddings and grouped attention, and discusses models like BERT, GPT, and T5. The discussion covers training LLMs, including compute, data set size, flash attention, data parallelism, model parallelism, pre-training, supervised fine-tuning (SFT), and preference tuning using reinforcement learning (RL) techniques like PPO and GRPO. Trending topics include adapting transformers for non-text inputs like images (Vision Transformer) and diffusion-based LLMs using masked tokens. The lecture concludes with a discussion of future trends, such as smaller LLMs and hardware optimization.

Outlines

Part 1: Course Recap, LLM Fundamentals

Part 2: Advanced Training, RL, Tools

Part 3: Multimodal, Vision, Diffusion

Part 4: Future Trends, Challenges, Resources

Sign in to continue reading, translating and more.

Open full episode in Podwise

Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 9 - Recap & Current Trends

Stanford Online

Part 1: Course Recap, LLM Fundamentals

Course Recap: From Tokenization to Text Generation with Transformers

Scaling Up: Large Language Models, Mixture of Experts, and Preference Tuning

Part 2: Advanced Training, RL, Tools

Reinforcement Learning Techniques: Reward Modeling and GRPO for Reasoning

Enhancing LLMs: Retrieval Augmented Generation, Tool Calling, and Evaluation

Part 3: Multimodal, Vision, Diffusion

Beyond Text: Adapting Transformers for Image Understanding with Vision Transformer

Image Processing and Language Models: Vision Language Models and Diffusion-Based LLMs

Diffusion Models for Text: Masked Tokens and Non-Autoregressive Generation

Part 4: Future Trends, Challenges, Resources

Cross-Modal Inspirations: Architecture, Inputs, and Data Curation in Transformers

Future Directions: Hardware Optimization, Small Language Models, and Key Challenges

Staying Updated: Resources for Continuous Learning in the Field

Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 9 - Recap & Current Trends

Stanford Online

Part 1: Course Recap, LLM Fundamentals

00:05Course Recap: From Tokenization to Text Generation with Transformers

Course Recap: From Tokenization to Text Generation with Transformers

11:16Scaling Up: Large Language Models, Mixture of Experts, and Preference Tuning

Scaling Up: Large Language Models, Mixture of Experts, and Preference Tuning

Part 2: Advanced Training, RL, Tools

24:03Reinforcement Learning Techniques: Reward Modeling and GRPO for Reasoning

Reinforcement Learning Techniques: Reward Modeling and GRPO for Reasoning

38:39Enhancing LLMs: Retrieval Augmented Generation, Tool Calling, and Evaluation

Enhancing LLMs: Retrieval Augmented Generation, Tool Calling, and Evaluation

Part 3: Multimodal, Vision, Diffusion

47:30Beyond Text: Adapting Transformers for Image Understanding with Vision Transformer

Beyond Text: Adapting Transformers for Image Understanding with Vision Transformer

55:56Image Processing and Language Models: Vision Language Models and Diffusion-Based LLMs

Image Processing and Language Models: Vision Language Models and Diffusion-Based LLMs

1:08:26Diffusion Models for Text: Masked Tokens and Non-Autoregressive Generation

Diffusion Models for Text: Masked Tokens and Non-Autoregressive Generation

Part 4: Future Trends, Challenges, Resources

1:23:35Cross-Modal Inspirations: Architecture, Inputs, and Data Curation in Transformers

Cross-Modal Inspirations: Architecture, Inputs, and Data Curation in Transformers

1:34:45Future Directions: Hardware Optimization, Small Language Models, and Key Challenges

Future Directions: Hardware Optimization, Small Language Models, and Key Challenges

1:47:46Staying Updated: Resources for Continuous Learning in the Field

Staying Updated: Resources for Continuous Learning in the Field