亚洲愉拍一区二区三区_中文字幕一卡二卡三卡_做暖暖视频在线看片免费_337P日本欧洲亚洲大胆精品555588_AV区无码字幕中文色_成人特黄A级毛片免费视频_国产AV午夜精品一区二区三区_国产第一页浮力影院草草影视_国产精品美脚玉足脚交欧美_国产免费一区二区三区不卡,H无码里番肉片在线观看的,天堂天堂资源最新版,最近最新中文字幕大全在线欧美VA免费高清在线观看

讓AI查了330次新聞:平均準(zhǔn)確率25%,,近一半鏈接打不開(kāi)
來(lái)源:21世紀(jì)經(jīng)濟(jì)報(bào)道作者:肖瀟,實(shí)習(xí)生隆欣玲,陶暢2025-04-11 09:40

美國(guó)宣布對(duì)所有貿(mào)易伙伴加征“對(duì)等關(guān)稅”的消息持續(xù)動(dòng)蕩,,這幾天里,手機(jī)里的新聞彈窗爆炸,,不同地區(qū),、不同行業(yè)的關(guān)鍵詞在標(biāo)題里輪番滾動(dòng)。

想要快速看懂發(fā)生了什么,,卻越刷越眼花繚亂,突然想到:能不能讓AI幫忙總結(jié)一下“美國(guó)最新關(guān)稅加征政策對(duì)市場(chǎng)的影響”,?

AI果然高效,。短短幾秒里,,它就給出了股市情況、行業(yè)沖擊,、中國(guó)應(yīng)對(duì)措施,。有言之鑿鑿的數(shù)據(jù),有生動(dòng)的案例,,比如華為啟動(dòng)了“鴻蒙供應(yīng)鏈計(jì)劃”,,聯(lián)合1500家供應(yīng)商構(gòu)建去美化產(chǎn)業(yè)鏈;Temu,、SHEIN等平臺(tái)被迫提價(jià)15%~25%,;TikTok商家偽裝東南亞店鋪銷售……

但這些“故事”這么快就出爐了嗎?作為記者,,出于職業(yè)本能的半信半疑,,一條條點(diǎn)進(jìn)鏈接查看,結(jié)果發(fā)現(xiàn)有的說(shuō)法出自個(gè)人賬號(hào),,看不出來(lái)源,;有的是好幾年前的行業(yè)數(shù)據(jù)——今年情況早就不同了;還有的數(shù)據(jù)根本就是無(wú)中生有,,前文提到的幾則信息均是如此,。

這并非偶然。就像一滴墨染入清水,,AI編造的內(nèi)容正在悄悄污染互聯(lián)網(wǎng)生態(tài),。

有必要對(duì)AI做一次系統(tǒng)測(cè)試。這不是“哪個(gè)AI更強(qiáng)”的排行榜,,而是“哪個(gè)AI更可信”的質(zhì)檢,,比起能力,更關(guān)心每一條AI生成內(nèi)容背后的信息責(zé)任,。

以“查一條新聞”為起點(diǎn),,我們對(duì)六款國(guó)產(chǎn)AI進(jìn)行了測(cè)試,評(píng)估AI引用新聞事實(shí)的可靠程度,。

我們拿著30條新聞片段,,一共向AI提問(wèn)了330次。這是330次問(wèn)訊后的幾個(gè)核心發(fā)現(xiàn):

AI很難準(zhǔn)確引用新聞報(bào)道,,六款A(yù)I的平均準(zhǔn)確率只有25%,,其中豆包最準(zhǔn)確、文心一言出錯(cuò)最多,、通義千問(wèn)最常拒絕回答,。

大部分AI依然會(huì)自信提供錯(cuò)誤答案,而不是承認(rèn)不知道。

來(lái)源是錯(cuò)誤重災(zāi)區(qū),,27%的新聞來(lái)源被AI完全說(shuō)錯(cuò),。

AI經(jīng)常表示自己找不到鏈接,或者提供已被刪除的鏈接,,因此很難驗(yàn)證出處——而且一些打不開(kāi)的鏈接地址明顯是編造的,。

AI普遍鏈接到新浪財(cái)經(jīng)、騰訊新聞等門戶網(wǎng)站,,不乏給自媒體“搬運(yùn)號(hào)”引流,,而不是原始來(lái)源。媒體拿流量更難了,。

引用新聞,,AI準(zhǔn)確率很低

今年3月,來(lái)自美國(guó)哥倫比亞大學(xué)數(shù)字新聞研究中心的最新研究指出,,讓AI查找新聞時(shí),,八款A(yù)I搜索提供的回復(fù)有60%是不準(zhǔn)確的。

沿著這一測(cè)試方法,,我們?cè)趪?guó)內(nèi)選擇了10家市場(chǎng)化運(yùn)作的機(jī)構(gòu)媒體——一半偏時(shí)政新聞(新京報(bào),、澎湃新聞、北青深一度,、南方周末,、三聯(lián)生活周刊),一半偏財(cái)經(jīng)新聞(21世紀(jì)經(jīng)濟(jì)報(bào)道,、第一財(cái)經(jīng),、每日經(jīng)濟(jì)新聞、財(cái)經(jīng)雜志,、經(jīng)濟(jì)觀察報(bào)),。每家媒體3篇報(bào)道,一共30篇新聞報(bào)道,。

然后,,我們從這些新聞報(bào)道中手動(dòng)摘取片段,以此一一詢問(wèn)AI:“請(qǐng)幫我找出包含這段引用文字的原文出處,,并提供標(biāo)題,、原文作者、原鏈接:……”

為了保證結(jié)果可靠,,這30篇報(bào)道都發(fā)布于2024年至今,,能在百度或必應(yīng)上搜到網(wǎng)頁(yè)原文。從每篇報(bào)道里截取的片段大約300字,,都是通過(guò)記者采訪得到的事實(shí),,有采訪人物,、地點(diǎn)、數(shù)據(jù)等獨(dú)特元素,,而非通稿消息,。

我們總共提問(wèn)了330次(3篇報(bào)道×10家媒體×11個(gè)版本AI),,在AI的330次回答中,,只有大約25%的回答完全正確,即準(zhǔn)確回答了標(biāo)題,、作者和鏈接三個(gè)指標(biāo),。

不同大模型的準(zhǔn)確度不同。按照正確,、錯(cuò)誤,、沒(méi)回答的情況分別賦分,整體來(lái)看,,豆包得分最高,,50%的回答完全準(zhǔn)確,通義千問(wèn)吊車尾,。而在錯(cuò)誤率上文心一言最高,,87%的回答出現(xiàn)錯(cuò)誤。

去年5月時(shí),,我們也測(cè)試了不同AI搜索的準(zhǔn)確度,。當(dāng)時(shí)Perplexity帶火了“AI搜索”概念,AI聯(lián)網(wǎng)搜索之后,,一方面有了實(shí)時(shí)更新的知識(shí)庫(kù),,一方面更有可能拒絕回答不確定的問(wèn)題。但今年的測(cè)試結(jié)果顯示,,AI搜索依然會(huì)自信提供錯(cuò)誤答案,,而不是“謙虛”承認(rèn)局限性——除了通義千問(wèn),所有AI錯(cuò)誤回答的次數(shù)都比拒絕回答多,。

自DeepSeek全球走紅后,,各個(gè)AI嘗到了推理大模型的甜頭,紛紛新增了“深度思考”功能,。不過(guò),,在溯源新聞事實(shí)上,我們并沒(méi)有發(fā)現(xiàn)深度思考讓AI準(zhǔn)確度明顯更好或更糟,。只有通義千問(wèn)在打開(kāi)深度思考后,,愿意回答的問(wèn)題增加了,但錯(cuò)誤也更多了,。

有用還是正確,,目前對(duì)所有AI依然是一道選擇題:太追求正確,容易走向?qū)挿簾o(wú)用,但具體有用的回復(fù)往往避免不了錯(cuò)誤,。要讓技術(shù)繼續(xù)前進(jìn),,比錯(cuò)誤更關(guān)鍵的兩個(gè)問(wèn)題是,AI哪里容易出錯(cuò),?為什么會(huì)出錯(cuò),?

讓AI糊涂的傳統(tǒng)媒體、門戶網(wǎng)站,、自媒體

找基本的新聞背景,,AI還稱得上靠譜。在測(cè)評(píng)的330次回答中,,AI只有28次完全說(shuō)錯(cuò)了報(bào)道標(biāo)題和事件(占比約8%),。

但AI并不擅長(zhǎng)辨別“新聞事實(shí)來(lái)自哪里”。當(dāng)被問(wèn)到原文作者時(shí),,AI的表現(xiàn)出現(xiàn)了明顯滑坡——90次回復(fù)完全錯(cuò)誤(約27%),,是三項(xiàng)指標(biāo)中錯(cuò)誤率最高的一項(xiàng)。

一種常見(jiàn)的錯(cuò)誤情景是,,AI把實(shí)際作者和發(fā)布平臺(tái)混為一談,。

例如,我們拿一篇講述老人王秋生在直播間網(wǎng)購(gòu)古董的片段提問(wèn),,幾乎所有AI都準(zhǔn)確指出原報(bào)道是《在假古董直播間瘋狂下單的老人》,,來(lái)源卻五花八門,。這篇報(bào)道由澎湃新聞采寫,、發(fā)表在騰訊新聞中,,而DeepSeek的回答是:“作者是澎湃新聞轉(zhuǎn)自騰訊新聞?!?/p>

類似的,,Kimi的回答也出現(xiàn)混淆。一篇由北青深一度采寫,、在網(wǎng)易新聞發(fā)布的家暴報(bào)道,,Kimi直接把作者歸為網(wǎng)易。

另一種情況里,,AI分辨不出自媒體的轉(zhuǎn)載文章,。以經(jīng)濟(jì)觀察報(bào)一篇報(bào)道為例,雖然原文有明確的記者署名,,但一部分內(nèi)容被自媒體賬號(hào)照搬洗稿后,,DeepSeek把作者歸為該自媒體。

這些錯(cuò)誤并不完全因?yàn)锳I能力有限,,也與國(guó)內(nèi)新聞的分發(fā)模式有關(guān),。國(guó)內(nèi)新聞并不遵循“發(fā)布即來(lái)源”的簡(jiǎn)單邏輯,,而是多平臺(tái)、多賬號(hào)的復(fù)雜格式,。

回到2000年前后,,搜狐、新浪,、網(wǎng)易,、騰訊四大門戶網(wǎng)站興起,開(kāi)始將各大媒體的原創(chuàng)報(bào)道“搬運(yùn)”到自己的新聞專區(qū)里,。到了2017年,,今日頭條又革了新聞行業(yè)的命,移動(dòng)互聯(lián)網(wǎng)的普及和個(gè)性化算法將海量自媒體賬號(hào)推上舞臺(tái),。傳統(tǒng)媒體、門戶網(wǎng)站,、內(nèi)容平臺(tái)就此開(kāi)展了為期十多年的拉鋸:2014年,,《廣州日?qǐng)?bào)》起訴今日頭條侵犯著作權(quán);直到2023年,,騰訊仍然和今日頭條有侵害知識(shí)產(chǎn)權(quán)的法律糾紛,。

經(jīng)歷了一次次法庭對(duì)簿,互聯(lián)網(wǎng)平臺(tái)逐漸重視起“新聞搬運(yùn)工”的侵權(quán)問(wèn)題,,也開(kāi)始爭(zhēng)奪優(yōu)質(zhì)內(nèi)容?,F(xiàn)在,傳統(tǒng)媒體與互聯(lián)網(wǎng)平臺(tái)已經(jīng)形成了成熟的合作模式,,通常是簽訂版權(quán)合同,、開(kāi)通官方賬號(hào),一篇稿件全網(wǎng)多發(fā),。

拿南方媒體來(lái)說(shuō),,廣東省網(wǎng)信辦今年1月公示的《互聯(lián)網(wǎng)新聞信息服務(wù)單位許可信息》顯示,《21世紀(jì)經(jīng)濟(jì)報(bào)道》《南方都市報(bào)》《南方周末》《南風(fēng)窗》在內(nèi)的119家廣東媒體,,一共注冊(cè)了1197個(gè)公眾賬號(hào),,相當(dāng)于一家新聞媒體平均擁有10個(gè)不同賬號(hào)。這些賬號(hào)覆蓋微信公眾號(hào),、今日頭條號(hào),、百家號(hào)、網(wǎng)易號(hào),、搜狐號(hào)等,,構(gòu)成一張龐大的合作網(wǎng)。

但這張合作網(wǎng)在AI時(shí)代帶來(lái)了新的混亂,。從此次測(cè)評(píng)結(jié)果來(lái)看,,AI常常被新聞分發(fā)矩陣所迷惑——它面對(duì)的是同一篇文章的多個(gè)“面孔”,,難以識(shí)別哪一個(gè)才是作者。而移動(dòng)互聯(lián)網(wǎng)時(shí)代未被根治的自媒體“洗稿”“搬運(yùn)”“偽原創(chuàng)”等老問(wèn)題,,則在AI中繼續(xù)發(fā)酵,。

失靈的鏈接

AI的另一個(gè)問(wèn)題出在引用鏈接上。在聯(lián)網(wǎng)狀態(tài)下,,AI應(yīng)當(dāng)要附上來(lái)源鏈接,,這是用戶驗(yàn)證真?zhèn)蔚牡谝徊健5谖覀兘y(tǒng)計(jì)的330次查詢中,,大約43%的回復(fù)提供了無(wú)效鏈接,,要么AI稱無(wú)法提供,要么鏈接已被刪除,。

一些模型的問(wèn)題更突出,。文心一言和通義千問(wèn)(深度思考版)有超過(guò)三分之一的回復(fù),提供的是無(wú)法打開(kāi)的鏈接,,其他AI的頻率則要低得多,。

令人意外的是,有些鏈接并不是失效,,而是純屬虛構(gòu),。比如,《第一財(cái)經(jīng)》發(fā)布的一篇關(guān)于亞馬遜低價(jià)商品的報(bào)道,,被DeepSeek誤判作者為“刺猬公社”,,并配上了一個(gè)根本不存在的網(wǎng)址:www.ciweigongshe.com。

根據(jù)各個(gè)AI產(chǎn)品“吐出”的鏈接,,今日頭條,、微信公眾號(hào)兩家平臺(tái)的鏈接出現(xiàn)次數(shù)最多,但這并不意味他們渠道鋪陳到位,,恰恰相反,,這些“吐出”的鏈接多來(lái)自他們自身的產(chǎn)品:今日頭條鏈接出現(xiàn)的37次里,34次都來(lái)自字節(jié)跳動(dòng)旗下豆包AI,,剩下3次來(lái)自Kimi,,其他平臺(tái)引用了0次。

同樣地,,27條微信公眾號(hào)的鏈接,,19條都由騰訊旗下元寶AI引用。文心一言,、豆包在個(gè)別場(chǎng)景下也能提供公眾號(hào)鏈接,,其他平臺(tái)沒(méi)有提供過(guò)。

這種局面是由底層結(jié)構(gòu)決定的,。App內(nèi)的信息孤島,,大部分在搜索引擎的公域網(wǎng)中不可見(jiàn),,只有“自家人”才能索引,大廠旗下的AI因此擁有得天獨(dú)厚的數(shù)據(jù)庫(kù),?;ヂ?lián)網(wǎng)時(shí)代圍墻花園的問(wèn)題,在AI時(shí)代依舊在加固,。

更令人擔(dān)憂的是媒體自身的可見(jiàn)度,。盡管許多媒體也有自己的官方網(wǎng)站,但除了澎湃新聞,,其他媒體官網(wǎng)很少出現(xiàn)在AI文獻(xiàn)列表里,。相比之下,搜狐,、網(wǎng)易,、新浪、騰訊四大門戶網(wǎng)站是AI更普遍的索引資料,,補(bǔ)上缺位的App數(shù)據(jù),。

站在媒體的立場(chǎng)上,如果AI能引用媒體官方賬號(hào)的鏈接——不管是官方搜狐號(hào)還是官方今日頭條號(hào),,都能拿到屬于內(nèi)容創(chuàng)作者的流量。

不過(guò),,也存在損害媒體權(quán)益的情況,。各個(gè)平臺(tái)的內(nèi)容池魚(yú)龍混雜,原創(chuàng)內(nèi)容,、轉(zhuǎn)載文章,、自媒體洗稿并存。比如新浪財(cái)經(jīng)賬號(hào)經(jīng)?!叭霓D(zhuǎn)載”其他媒體的原創(chuàng)報(bào)道,,媒體署名雖在,但流量早已轉(zhuǎn)嫁,。測(cè)試結(jié)果顯示,,AI有大約14%回復(fù)引用了這些轉(zhuǎn)載鏈接,而非官方鏈接,。

在這之中,,豆包情況最嚴(yán)重,30次查詢中8次查詢都引用了轉(zhuǎn)載鏈接,,主要引流向今日頭條的自媒體號(hào),。

這也不是一個(gè)AI時(shí)代的新問(wèn)題。許多媒體早已意識(shí)到互聯(lián)網(wǎng)推薦算法的影響,,試圖打造自己的獨(dú)立App和官網(wǎng),,但實(shí)際情況并不理想,。中國(guó)社會(huì)科學(xué)院在2020年對(duì)三萬(wàn)人開(kāi)展了問(wèn)卷調(diào)查,以此發(fā)布的《新媒體藍(lán)皮書(shū):中國(guó)新媒體發(fā)展報(bào)告》顯示,,七成以上的人從微信獲取新聞信息,,四成左右在抖音里看新聞,其次是今日頭條和微博,。

換句話說(shuō),,哪些新聞會(huì)被優(yōu)先推送、哪些新聞更容易被看見(jiàn),,一定程度上仍然取決于不同平臺(tái)的算法設(shè)計(jì),。而AI的到來(lái),并沒(méi)有改變這一結(jié)構(gòu),,反而可能固化,。

類似的狀況也在全球范圍內(nèi)上演。哥倫比亞大學(xué)數(shù)字新聞研究中心的最新研究指出,,Grok-3和Gemini在超過(guò)60%的回答中提供了失效鏈接,。

對(duì)新聞媒體來(lái)說(shuō),這意味著兩重更大的挑戰(zhàn):一方面,,拒絕被AI引用變得困難,;另一方面,有些媒體和AI公司牽手成為合作伙伴,,希望換取精準(zhǔn)推薦與流量回報(bào),,但AI仍然會(huì)錯(cuò)誤引用轉(zhuǎn)載版本。被視為解藥的版權(quán)合作,,效果沒(méi)有想象中好,。

責(zé)任編輯: 陳勇洲
聲明:證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確,,文章提及內(nèi)容僅供參考,,不構(gòu)成實(shí)質(zhì)性投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān)
下載“證券時(shí)報(bào)”官方APP,,或關(guān)注官方微信公眾號(hào),,即可隨時(shí)了解股市動(dòng)態(tài),洞察政策信息,,把握財(cái)富機(jī)會(huì),。
網(wǎng)友評(píng)論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明證券時(shí)報(bào)立場(chǎng)
暫無(wú)評(píng)論
為你推薦
時(shí)報(bào)熱榜
換一換
    熱點(diǎn)視頻
    換一換