在本集科技浪 podcast 中,我們首先介紹了鼎新電腦的知識管理平台 ChatFile。這款基於 RAG(檢索增強生成)技術的產品,專門解決大型語言模型(LLM)常見的兩大問題:一是容易「一本正經地瞎掰」,二是缺乏訓練資料以外的知識。ChatFile 擁有簡單的聊天介面,使用者可以上傳各種格式的文件,並透過自家訓練的中文 embedding 模型,精準提取文件中的相關資訊來回答問題,提供高效且經濟的研究助理功能。 接下來,節目重點討論了 Google 最近推出的 Gemini 大型語言模型,分析了其多模態能力、不同尺寸的模型版本,以及與 GPT-4 的比較。主持人指出,Google 在 Gemini 的宣傳中存在誇大甚至造假的情況,例如 Demo 影片的誤導性展示,以及在效能比較中使用對自己有利的測試方法。儘管如此,Gemini 仍展現出與 GPT-4 相當的實力,並在邊緣 AI 領域取得了一些突破。 最後,節目提到 Gemini 的更多技術細節,包括其模型架構、訓練硬體以及 AlphaCode2 編碼模型等,將在下集深入探討。
Sign in to continue reading, translating and more.
Continue