摘要:清華大學(xué)DeepSeek教程第五版由清華大學(xué)雙聘教授 @新媒沈陽團隊撰寫,主要圍繞 AI 幻覺展開研究,以 DeepSeek 為例深入探討其現(xiàn)象、成因、評測、應(yīng)對策略及創(chuàng)造力價值。
感謝公眾號/招文袋提供分享,有興趣一起交流學(xué)習(xí)的可關(guān)注公眾號/招文袋,也可在文末掃碼加入知識星球-招文袋共同探討。
清華大學(xué)DeepSeek教程第五版由清華大學(xué)雙聘教授 @新媒沈陽團隊撰寫,主要圍繞 AI 幻覺展開研究,以 DeepSeek 為例深入探討其現(xiàn)象、成因、評測、應(yīng)對策略及創(chuàng)造力價值。
AI 幻覺的定義:AI 幻覺指模型生成與事實不符、邏輯斷裂或脫離上下文的內(nèi)容,分為事實性幻覺(與現(xiàn)實事實不一致)和忠實性幻覺(與用戶指令或上下文不一致) 。
產(chǎn)生 AI 幻覺的原因:包括數(shù)據(jù)偏差、泛化困境、知識固化、意圖誤解等。此外,音樂因具有主觀性、抽象性和可感知性差異等特點,雖不存在傳統(tǒng)意義上的幻覺,但也有邏輯斷裂的歌詞等潛在表現(xiàn)。
AI 幻覺評測:通過隨機生成提示語和抽取事實性幻覺測試題進行人工判斷標注與交叉驗證。測試結(jié)果顯示,不同模型幻覺率不同,如通用性測試中 DeepSeekV3 幻覺率為 2%、DeepSeekR1 為 3%;事實性測試中 DeepSeekV3 幻覺率達 29.67%、DeepSeekR1 為 22.33% 。推理能力與幻覺率存在雙向作用機制,聯(lián)網(wǎng)搜索、雙 AI 驗證、提示詞工程等方法可降低幻覺率。
AI 幻覺的應(yīng)對策略:普通用戶可采用三角驗證法,警惕 “過度合理” 的回答,理解并利用幻覺帶來的創(chuàng)意靈感。具體方法包括聯(lián)網(wǎng)搜索、雙 AI 驗證、提示詞工程(知識邊界限定、對抗性提示)等。技術(shù)層面可采用 RAG 框架、結(jié)合外部知識庫、精細訓(xùn)練、開發(fā)評估工具等方案。
AI 幻覺的價值:在科學(xué)發(fā)現(xiàn)、文藝與設(shè)計、娛樂與游戲、技術(shù)創(chuàng)新等領(lǐng)域具有創(chuàng)造力價值。如助力蛋白質(zhì)設(shè)計獲諾貝爾化學(xué)獎,為游戲開發(fā)提供靈感,提升自動駕駛系統(tǒng)識別精度等。
完整下載:清華大學(xué)第五版:DeepSeek與AI幻覺.pdf