
本次講座李宏毅教授主要講述了通用模型的終身學習,區別了 Pre-training 和 Post-training,並強調了後訓練的三個目標:可靠性、通用性和局部性。講座中,教授闡述了持續學習的重要性,並探討了如何評估模型訓練的成功與否,同時提醒聽眾最好的後訓練是不進行後訓練。李教授分享了四種技術:梯度下降微調、模型編輯、模型合併以及測試時訓練,詳細解釋了每種技術的原理、應用案例以及可能遇到的問題,並提供了相應的解決方案和參考文獻。
Sign in to continue reading, translating and more.
Continue