#335 Sriram Raghavan: Why IBM Is Betting Everything on Small AI Models

Small language models (SLMs) offer a more sustainable and efficient path for enterprise AI adoption than massive, monolithic models. By training 2-billion and 8-billion parameter models directly—rather than distilling them from larger ones—developers maintain base capabilities and safety alignment while controlling data lineage. Advanced techniques like reinforcement learning (RL) and inference-time scaling allow these compact models to match the performance of significantly larger systems on complex tasks like coding and mathematics. This shift toward "generative computing" treats models as modular components within a runtime, utilizing LoRa adapters and procedural logic to handle specific functions on demand. This architectural decomposition enables organizations to deploy fit-for-purpose AI across hybrid environments, optimizing for memory requirements and latency rather than raw parameter counts, ultimately facilitating faster innovation cycles and more reliable, governable agentic workflows.

Outlines

Sign in to continue reading, translating and more.

Continue

Eye On A.I.

Advantages of Directly Training Small Language Models

Evolution of Data Quality and Training Pipelines

Architectural Innovations and Inference Scaling

Generative Computing and Modular Agentic Workflows

Strategies for Continuous Learning and Model Adaptability

Enterprise AI Strategy and Domain-Specific Agentic Applications

#335 Sriram Raghavan: Why IBM Is Betting Everything on Small AI Models

Eye On A.I.

00:00Advantages of Directly Training Small Language Models

Advantages of Directly Training Small Language Models

06:39Evolution of Data Quality and Training Pipelines

Evolution of Data Quality and Training Pipelines

13:53Architectural Innovations and Inference Scaling

Architectural Innovations and Inference Scaling

23:34Generative Computing and Modular Agentic Workflows

Generative Computing and Modular Agentic Workflows

38:40Strategies for Continuous Learning and Model Adaptability

Strategies for Continuous Learning and Model Adaptability

52:51Enterprise AI Strategy and Domain-Specific Agentic Applications

Enterprise AI Strategy and Domain-Specific Agentic Applications