久久久久亚洲精品天堂_久久综合噜噜激激的五月天_一本久道久久综合_日韩精品久久久久影院

人民網(wǎng)
人民網(wǎng)>>教育

生成式AI“幻覺”困境如何破解

2025年01月31日08:44 | 來源:科技日?qǐng)?bào)
小字號(hào)

原標(biāo)題:生成式AI“幻覺”困境如何破解

圖片來源:英國(guó)《自然》網(wǎng)站

圖片來源:英國(guó)《自然》網(wǎng)站

人工智能(AI)技術(shù)正以前所未有的速度發(fā)展,生成式AI憑借其驚人的創(chuàng)造力,不斷刷新人們的認(rèn)知。然而,即便是看似“聰明絕頂”的AI,也難逃“幻覺”的困擾。這裡的“幻覺”,指的是AI生成看似合理但實(shí)際不準(zhǔn)確或虛假的信息。

英國(guó)《自然》雜志網(wǎng)站在1月22日的報(bào)道中指出,AI“幻覺”可能會(huì)引發(fā)嚴(yán)重后果,科學(xué)家正各出奇招,力求降低其發(fā)生率。這些措施包括增加事實(shí)核查、對(duì)AI進(jìn)行“腦部掃描”等,以促進(jìn)AI的健康、高效發(fā)展。

主因是數(shù)據(jù)模糊

各種生成式AI,包括由大語言模型驅(qū)動(dòng)的聊天機(jī)器人,常常會(huì)編造信息。它們有時(shí)會(huì)模糊事實(shí)與虛構(gòu),在看似真實(shí)的陳述中夾雜錯(cuò)誤信息。這既是其創(chuàng)造力的體現(xiàn),也是其不足之處。

美國(guó)佐治亞理工學(xué)院理論計(jì)算機(jī)科學(xué)家桑托什·威姆帕拉解釋稱,大語言模型的設(shè)計(jì)原理並非輸出準(zhǔn)確事實(shí),而是通過模式識(shí)別生成答案。其內(nèi)部復(fù)雜的運(yùn)行機(jī)制迄今仍像一個(gè)“黑匣子”,人們難以洞悉其推理過程。

美國(guó)加州Vectara公司旨在減少生成式AI的“幻覺”。其聯(lián)合創(chuàng)始人阿姆爾·阿瓦達(dá)拉表示,在訓(xùn)練過程中,這些模型會(huì)壓縮數(shù)萬億個(gè)單詞間的關(guān)系,隨后通過一個(gè)龐大的網(wǎng)絡(luò)模型重新展開這些信息。盡管這些模型能夠重構(gòu)出接近98%的訓(xùn)練內(nèi)容,但剩下2%的內(nèi)容卻會(huì)讓其“誤入歧途”,生成不準(zhǔn)確或虛假信息。

導(dǎo)致AI出現(xiàn)“幻覺”的原因多種多樣,其中訓(xùn)練數(shù)據(jù)中的模糊性和錯(cuò)誤是常見因素。也有人認(rèn)為,即使訓(xùn)練數(shù)據(jù)準(zhǔn)確無誤,AI也有可能產(chǎn)生“幻覺”。這種現(xiàn)象與某一事實(shí)的稀缺程度密切相關(guān)。因此,即使經(jīng)過人類反饋調(diào)整過的聊天機(jī)器人,也無法完全避免出錯(cuò)。

多領(lǐng)域面臨考驗(yàn)

AI的“幻覺”可能會(huì)給人們的工作和生活帶來較大影響。

在新聞?lì)I(lǐng)域,大語言模型可能生成虛假新聞事件,擾亂信息傳播秩序,誤導(dǎo)公眾認(rèn)知。Vectara公司針對(duì)文檔內(nèi)容開展的研究表明,一些聊天機(jī)器人編造事實(shí)、虛構(gòu)信息的幾率高達(dá)30%。世界經(jīng)濟(jì)論壇發(fā)布的《2025年全球風(fēng)險(xiǎn)報(bào)告》顯示,錯(cuò)誤和虛假信息是2025年全球面臨的五大風(fēng)險(xiǎn)之一。

在法律領(lǐng)域,它可能引用虛構(gòu)的法律條文和案例。比如,2023年美國(guó)律師史蒂文·施瓦茨就因“輕信”ChatGPT,在法庭文件中引用了並不存在的法律案例。而在醫(yī)學(xué)領(lǐng)域,它可能提供錯(cuò)誤的診斷和治療建議,危及患者生命。

《自然》在報(bào)道中指出,AI“幻覺”在科學(xué)參考文獻(xiàn)方面出現(xiàn)錯(cuò)誤的情況也極為普遍。2024年的一項(xiàng)研究發(fā)現(xiàn),各類聊天機(jī)器人在提及參考文獻(xiàn)時(shí)的出錯(cuò)率在30%至90%之間。它們至少會(huì)在論文標(biāo)題、第一作者或發(fā)表年份上出現(xiàn)偏差。雖然聊天機(jī)器人都帶有警告標(biāo)簽,提醒用戶對(duì)重要信息進(jìn)行二次核實(shí)。但如果用戶對(duì)聊天機(jī)器人的回復(fù)深信不疑,可能會(huì)引發(fā)一系列問題。

多舉措減少“幻覺”

為進(jìn)一步提升AI的精確度,科學(xué)家正想方設(shè)法降低其“幻覺”。

例如,增加模型訓(xùn)練參數(shù)和訓(xùn)練時(shí)長(zhǎng)可有效減少“幻覺”。但這種方法需要付出高昂的計(jì)算成本,並可能削弱聊天機(jī)器人的其他能力,如機(jī)器學(xué)習(xí)算法對(duì)未知數(shù)據(jù)的預(yù)測(cè)和處理能力。

此外,使用更大、更干淨(jìng)的數(shù)據(jù)集進(jìn)行訓(xùn)練,也是降低AI模型“幻覺”出現(xiàn)的有效途徑。然而,當(dāng)前可用數(shù)據(jù)的有限性限制了這一方法的應(yīng)用。

檢索增強(qiáng)生成(RAG)技術(shù)也為減少AI“幻覺”提供了新思路。該方法通過讓聊天機(jī)器人在回復(fù)問題前參考給定的可信文本,從而確保回復(fù)內(nèi)容的真實(shí)性,以此減少“幻覺”的產(chǎn)生。在醫(yī)療和法律等需要嚴(yán)格遵循經(jīng)過驗(yàn)証的知識(shí)的領(lǐng)域,RAG技術(shù)備受青睞。

不過,美國(guó)斯坦福大學(xué)計(jì)算機(jī)科學(xué)家米拉柯·蘇茲根表示,盡管RAG能提升內(nèi)容真實(shí)性,但其能力有限。蘇茲根團(tuán)隊(duì)的研究表明,一些為法律研究開發(fā)的、號(hào)稱“無幻覺”的RAG增強(qiáng)模型雖有所改進(jìn),但仍存在不足。

開發(fā)者也可以使用一個(gè)與AI訓(xùn)練方式不同的獨(dú)立系統(tǒng),通過網(wǎng)絡(luò)搜索對(duì)聊天機(jī)器人的回復(fù)進(jìn)行事實(shí)核查,谷歌的“雙子星”系統(tǒng)便是一個(gè)典型例子。該系統(tǒng)提供了“雙重核查響應(yīng)”功能:內(nèi)容如果突出顯示為綠色,表示其已通過網(wǎng)絡(luò)搜索驗(yàn)証﹔內(nèi)容如果突出顯示為棕色,則表示其為有爭(zhēng)議或不確定的內(nèi)容。但是,這種方法計(jì)算成本高昂且耗時(shí),而且系統(tǒng)仍會(huì)產(chǎn)生“幻覺”,因?yàn)榛ヂ?lián)網(wǎng)上錯(cuò)誤信息泛濫。

在去年6月出版的《自然》雜志上,英國(guó)牛津大學(xué)科學(xué)家刊發(fā)論文稱,他們利用“語義熵”,通過概率來判斷大語言模型是否出現(xiàn)了“幻覺”。語義熵是信息熵的一種,被用於量化物理系統(tǒng)中所包含的信息量。通過評(píng)估AI模型在特定提示詞下生成內(nèi)容的不確定性,來計(jì)算模型的困惑程度,從而為用戶或模型提供警示,提醒其採(cǎi)取必要的循証措施,確保更準(zhǔn)確的答案輸出。

美國(guó)卡內(nèi)基梅隆AI研究人員安迪·鄒採(cǎi)用的方法是在大語言模型回答問題時(shí),繪制其內(nèi)部計(jì)算節(jié)點(diǎn)的激活模式。他形象地稱之為“給AI做腦部掃描”。利用不同的計(jì)算節(jié)點(diǎn)活動(dòng)模式,可以告訴我們AI模型是在“說真話”,還是在“胡說八道”。(記者 劉 霞)

(責(zé)編:郝孟佳、孫競(jìng))

分享讓更多人看到

推薦閱讀
返回頂部
久久久久亚洲精品天堂_久久综合噜噜激激的五月天_一本久道久久综合_日韩精品久久久久影院
  • 一区二区三区四区国产精品| 91色porny| 欧美zozozo| 国内成人精品2018免费看| 欧美一区二区三区日韩| 丁香婷婷综合激情五月色| 国产精品久久久久影院| 亚洲天堂久久久久久久| 成人国产免费视频| 日韩午夜在线观看视频| 色欧美88888久久久久久影院| 久久精品一区二区三区不卡牛牛| 日本vs亚洲vs韩国一区三区二区| 免费xxxx性欧美18vr| 久久影视一区二区| 色94色欧美sute亚洲线路一ni| 91精选在线观看| 欧美国产欧美综合| 91福利国产精品| 色老汉av一区二区三区| 综合激情网...| 丝袜美腿成人在线| 亚洲精品成人少妇| 成人app软件下载大全免费| 三级久久三级久久| 亚洲免费资源在线播放| 欧美肥大bbwbbw高潮| 亚洲欧美精品午睡沙发| 久久久综合激的五月天| 亚洲黄色免费电影| 天天操天天干天天综合网| 日韩免费视频线观看| 91精品久久久久久久久99蜜臂| 99re免费视频精品全部| 欧美性受xxxx黑人xyx| 欧美精品色一区二区三区| 欧美精品九九99久久| 亚洲精品视频免费看| 亚洲午夜在线电影| 亚洲日本va午夜在线影院| 国产喷白浆一区二区三区| 91精品国产福利| 国产精品免费久久| 国产在线不卡视频| 日韩欧美一级二级三级久久久| 亚洲国产中文字幕在线视频综合| 蜜臂av日日欢夜夜爽一区| 日韩高清在线一区| 日韩欧美成人午夜| 婷婷开心激情综合| 日韩一区国产二区欧美三区| 久久久777精品电影网影网| 日本麻豆一区二区三区视频| 亚洲欧美日韩国产综合在线| 成a人片亚洲日本久久| 久久久99久久精品欧美| 91久久线看在观草草青青| 国产精品久久久久久户外露出| 欧美一区二区三区免费观看视频| 一区二区三区精品在线观看| 国产河南妇女毛片精品久久久| 成人免费视频一区二区| 一片黄亚洲嫩模| 国产精品看片你懂得| 欧美videossexotv100| 不卡视频一二三| 国产女人18毛片水真多成人如厕| 久久国产精品72免费观看| 欧美日韩午夜在线| 91精彩视频在线观看| 成人动漫一区二区| 不卡一区二区在线| 韩国中文字幕2020精品| 成人午夜在线免费| 一本大道久久a久久综合| 欧美特级限制片免费在线观看| 爽好多水快深点欧美视频| 丝袜亚洲另类欧美综合| 日本久久一区二区三区| 欧美图区在线视频| www久久精品| 91视频国产观看| 欧美日韩国产小视频在线观看| 黄色小说综合网站| 日韩免费观看高清完整版| 亚洲成人av中文| 亚洲午夜av在线| 欧美在线不卡视频| 国产精品三级av在线播放| 国产寡妇亲子伦一区二区| 99精品黄色片免费大全| 国产成人一区在线| 国产日韩av一区二区| 一区二区三区高清| 六月丁香综合在线视频| 亚洲三级免费观看| 99久久精品国产导航| 欧美日韩国产综合一区二区三区| 欧美一区二区三区免费视频| 欧美精品一区视频| 一本色道久久综合亚洲aⅴ蜜桃| 亚洲一区二区成人在线观看| 久久精品国产99久久6| 首页亚洲欧美制服丝腿| 国产麻豆精品久久一二三| 国产精品少妇自拍| 久久精品免视看| 日本一区二区三区久久久久久久久不| 中文字幕视频一区| 成人看片黄a免费看在线| 日韩欧美国产wwwww| 亚洲图片欧美综合| 亚洲国产精品精华液2区45| 久久先锋资源网| 欧美日韩三级视频| 91亚洲精品一区二区乱码| 日韩精品一区二区三区老鸭窝| 精品欧美乱码久久久久久1区2区| 久久女同性恋中文字幕| 日韩一区二区免费视频| 亚洲一区二区影院| 日韩福利电影在线| 亚洲成a人片在线不卡一二三区| 有坂深雪av一区二区精品| 日韩一区在线免费观看| 亚洲美女区一区| 激情另类小说区图片区视频区| 色婷婷久久一区二区三区麻豆| 中文字幕在线不卡视频| 亚洲视频在线观看一区| 午夜久久久久久久久| 国产精品久久久久久久裸模| 日韩午夜三级在线| 香港成人在线视频| 久久久久国产精品麻豆ai换脸| 91网页版在线| 欧美精品一区二区不卡| 日韩一区二区在线观看| 日本一区二区三区四区| 亚洲一卡二卡三卡四卡| 6080yy午夜一二三区久久| 91精品婷婷国产综合久久| 精品sm在线观看| 欧美成人一区二区| 岛国av在线一区| 在线观看视频一区二区欧美日韩| 欧美韩日一区二区三区四区| 色婷婷综合久色| 亚洲视频一区二区在线| 韩国三级电影一区二区| 91麻豆精品91久久久久久清纯| 中文字幕在线不卡一区二区三区| 久久精品国产亚洲5555| 国产亚洲欧美日韩俺去了| 日韩欧美在线网站| 国产精品久久久久久久久免费桃花| 亚洲视频资源在线| 国产精品99精品久久免费| 久久精品一区四区| 视频一区免费在线观看| 国产麻豆欧美日韩一区| 国产精品综合视频| 国产精品一二三区| 欧美区在线观看| 一级特黄大欧美久久久| 激情综合网激情| 欧美亚洲国产一卡| 中文一区二区在线观看| 久久精品这里都是精品| 久久精品国产999大香线蕉| 久久久亚洲高清| 波波电影院一区二区三区| 91精品国产综合久久精品图片| 精品一区二区成人精品| 欧美日韩大陆在线| 国产高清一区日本| 国产精品无遮挡| 在线视频国内自拍亚洲视频| 中文字幕不卡在线播放| 亚洲免费观看视频| 91麻豆精品国产91久久久| 欧美日韩综合一区| 91精品国产综合久久精品图片| 国产91精品精华液一区二区三区| 日本aⅴ免费视频一区二区三区| 欧美妇女性影城| 午夜精品aaa| 亚洲欧美影音先锋| 亚洲va欧美va人人爽午夜| 欧美中文字幕亚洲一区二区va在线| 一区二区三区欧美| 国产麻豆一精品一av一免费| 亚洲欧美在线aaa| 麻豆久久一区二区| 一区二区三区精品久久久| 国产成人超碰人人澡人人澡| 欧美一区二区精品在线| 91视视频在线直接观看在线看网页在线看| 成人午夜视频网站| 26uuu亚洲综合色欧美|