Lecture 2 – Data, Structure, Information (MIT How to AI Almost Anything, Spring 2025) | Paul Liang

In this lecture on Data Structure and Learning, Paul Liang discusses the importance of data in machine learning and AI, covering various data forms such as visual, language, auditory, sensing, set, and graph data. He generalizes these forms into a discussion about data properties and modeling architectures, using real-world datasets and labels. The lecture also covers logistics, including Piazza enrollment, project preferences, and schedule changes due to President's Day. Liang introduces sensory modalities, abstractions from raw data, and different ways to represent data, like bag of words and spectrograms. He also explains different learning paradigms: supervised, unsupervised, and reinforcement learning, along with interactive learning paradigms like curriculum learning and human-in-the-loop learning, and emphasizes the importance of data collection, cleaning, visualization, and evaluation metrics before model selection to avoid overfitting.

Outlines

Sign in to continue reading, translating and more.

Continue

Lecture 2 – Data, Structure, Information (MIT How to AI Almost Anything, Spring 2025)

Paul Liang

Introduction to Data Structures and Learning: Lecture Overview and Logistics

Data Modalities and Abstractions in Machine Learning

Audio, Sensing, and Tabular Data Modalities

Graph and Set Data Modalities

Modality Profiles and Key Dimensions of Data

Supervised, Unsupervised, and Reinforcement Learning Paradigms

Advanced Learning Paradigms: Multimodal, Multitask, Transfer, and Interactive Learning

Modeling, Overfitting, and Data Handling Tips

Lecture 2 – Data, Structure, Information (MIT How to AI Almost Anything, Spring 2025)

Paul Liang

00:00Introduction to Data Structures and Learning: Lecture Overview and Logistics

Introduction to Data Structures and Learning: Lecture Overview and Logistics

04:33Data Modalities and Abstractions in Machine Learning

Data Modalities and Abstractions in Machine Learning

10:39Audio, Sensing, and Tabular Data Modalities

Audio, Sensing, and Tabular Data Modalities

17:40Graph and Set Data Modalities

Graph and Set Data Modalities

23:18Modality Profiles and Key Dimensions of Data

Modality Profiles and Key Dimensions of Data

31:29Supervised, Unsupervised, and Reinforcement Learning Paradigms

Supervised, Unsupervised, and Reinforcement Learning Paradigms

40:42Advanced Learning Paradigms: Multimodal, Multitask, Transfer, and Interactive Learning

Advanced Learning Paradigms: Multimodal, Multitask, Transfer, and Interactive Learning

47:43Modeling, Overfitting, and Data Handling Tips

Modeling, Overfitting, and Data Handling Tips