快訊

114學測首日登場!理組迎戰 數學A、自然科解答一次看

下周兩波東北季風先乾後濕 過年前還有一波更強冷空氣

利菁突爆料兒子父親身分 謝金燕親回應:他人的恥笑歧視我承受

沒有通過認知測試 研究:聊天機器人已出現數位痴呆症

(首圖來源:Pixabay)
(首圖來源:Pixabay)

【文‧黃嬿】

AI 大腦愈來愈成熟,會逐漸取代人類工作 ,甚至連醫生都在擔憂,聊天機器人是否超越醫生。一項研究讓幾個大型聊天機器人接受癡呆症測試,發現幾乎所有聊天機器人都顯示有輕度認知障礙挑戰 AI 很快就會取代醫生的假設。

多項研究發現,大型語言模型 (LLM) 非常擅長執行醫療診斷,但人類大腦會老化,機器人可能也會,但還沒有科學驗證。這次研究員使用蒙特利爾認知評估 (MoCA),測試幾個頂尖語言模型的認知能力,包括 OpenAI ChatGPT 4 / 4o、Anthropic Claude 3.5 Sonnet  Google Gemini 1 / 1.5

MoCA 測試為簡短任務和問題,包括注意力、記憶力、語言、視覺空間技能,以及執行功能等,普遍檢測認知障礙和失智症早期跡象,通常用在老年人,滿分為 30 分,26 分以上一般認為正常。ChatGPT 4o MoCA 測試得高分,但也只是勉強達標的 26 分,其次是 ChatGPT 4 Claude 得到 25 分,Gemini 1.0 得分最低。

視覺空間與執行任務是 AI 弱點

所有聊天機器人多數任務表現都不錯,如命名、注意力、語言和抽象,但視覺空間和執行任務表現不佳,包括軌跡製作任務,需按升序連接圓圈中數字和字母,以及時鐘繪圖測試,要求測試者繪製顯示特定時間的鐘面。Gemini 1 / 1.5 在相當簡單的延遲回憶任務,記住五個單字序列都失敗。

研究員測試視覺空間認知力,發現聊天機器人無法表現同理心,也無法準確解釋複雜視覺場景,缺乏同理心是額顳葉失智症的代表症狀。只有 ChatGPT 4o 通過史楚普實驗 (Stroop test),用顏色名稱和字體顏色組合衡量干擾如何影響反應時間。

AI 無法醫學診斷

研究作者表示,舊版聊天機器人就像老年患者,測試往往表現較差,挑戰 AI 很快會取代醫生的假設。至於所有大型語言模型視覺抽象和執行功能任務都失敗,突顯聊天機器人的重大弱點,可能阻礙臨床環境運用。

這研究目的不是醫學診斷 AI,而是駁回一波研究浪潮,這些研究認為 AI 可用於醫療領域,特別是當診斷工具

聊天機器人明顯認知障礙可能會影響醫療診斷的可靠性並降低病患信心,結論是,至少目前所見,醫生不太可能被大型語言模型取代。論文刊登於《英國醫學期刊》。

【本文章由科技新報授權提供,更多精彩內容請詳科技新報官網

延伸閱讀

「豆包」大模型 帶旺概念股

小米進擊AI大模型

五条君快做!《戀上換裝娃娃》喜多川海夢泳裝坐姿Figure彩色原型公開

AI VTuber Neuro兩歲了!自己展示超可愛新L2D模型 堪稱Vedal火力展示

相關新聞

電動車一個月不開不充電會怎樣?

電動車上的鋰電池是許多人充滿疑慮的重點,有人擔心它壽命不長,有台灣人害怕氣溫太低讓電池無法運作,也有人說一個禮拜不充電就會壞掉,來看看這位電動車主的小實驗是否證明這項傳聞?

黃石超級火山噴發人類滅亡?《自然》研究稱千年後的事

面積約四分之一台灣大小的美國黃石公園,有 500 多個噴湧的間歇泉,還有許多沸騰的溫泉,此處是一座活火山,過去許多專家稱,黃石公園有可能發生災難性的超級噴發,引發人類生存危機,但《自然》期刊研究發現,黃石公園離大規模噴發還早得很。

川普政府可望開大門?未來搭星艦出國旅行不是夢

比現在客機更快的飛行器一直是人類夢想,即使協和客機停運也擋不住這種需求。樂觀科學家預測,SpaceX Starship 火箭不只為月球和火星任務擔任運輸載具,現在可能川普政府支持下提供地球交通服務,將來紐約到上海只需 39 分鐘。

Beta世代將來臨 專家:更少接觸社群媒體、氣候變遷是大事

你聽過千禧世代、Z世代,可能有些人聽過 Alpha 世代,很快的,下代 2025 年就會來到世界。2025 年 1 月 1 日開始,最新世代群體「Beta 世代」將來臨,這個世代會看到 22 世紀曙光。

當組團合作行動 實驗證明螞蟻團隊精神比人類強

與螞蟻打過交道的人都知道螞蟻是高度社會化生物,很少見到螞蟻獨自外出,這種合作分工行為最早可追溯至 1 億年前。最近有研究設計了一項有趣迷宮合作實驗,嘗試比較人類和螞蟻誰更擅長操縱巨大物體穿過迷宮,結果發現螞蟻群體行動表現比人類群體還好。

為何年紀愈大喝酒愈累?專家:代謝變差、體內水分減少

現代焦慮壓力纏身,飲酒可能是隨手可得的廉價小確幸,但年紀愈來愈大時,為什麼更容易感受到飲酒的負面影響?營養學家解釋,是因為老化身體代謝減慢,水分降低,導致酒精負面作用持續更久。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。