LLMs
」 AI 人工智慧
網路廢文刷到「腐爛了」?研究曝光長期吃社群垃圾文 AI推理力直接崩「準確率下滑17.7%」
由德州農工大學(Texas A&M University)、德州大學奧斯汀分校(University of Texas at Austin)與普渡大學(Purdue University)組成的研究團隊揭露,大型語言模型(Large Language Models, LLMs)若長期吸收來自社群媒體的低品質文字,會出現明顯的「認知退化」,研究團隊將此現象稱為「大腦腐爛」(Brain Rot)。根據《商業標準報》(Business Standard)報導,研究於10月15日以《LLMs Can Get Brain Rot!》(《大型語言模型也會得大腦腐爛!》)為題發表。研究者發現,AI若不斷接觸爆紅貼文、釣魚標題與互動導向的短內容,會造成推理能力下降、語境理解力受損,甚至失去倫理一致性。這種退化模式與人類長期沉迷於膚淺媒體後專注力變差的狀況極為相似。研究團隊將此現象定義為「LLM大腦腐爛假說」(LLM Brain Rot Hypothesis),指出當AI模型長期被餵食無營養、以點擊率為導向的內容時,將失去深度思考與邏輯推理能力。這項概念借用了「網際網路大腦腐爛」(Internet Brain Rot)一詞,該詞原本用來形容人類在長期接觸社群平台與無意義短影片後的精神疲乏與專注退化。為了驗證這項假說,研究團隊設計了實驗,選取社群平台X上的真實資料作為樣本。他們以兩項標準定義「垃圾內容」,其一為互動度極高但資訊量極低的貼文(M1),例如為吸引注意力而設計的爆紅短句;其二為語義品質低落(M2),包括誇張標題、煽情敘述或毫無實質內容的文章。團隊將這些貼文混合成不同比例的訓練集,讓四種主流AI模型,包括Llama3與Qwen2.5,反覆進行預訓練。結果顯示,當模型完全以垃圾內容訓練時,其推理準確率從74.9%驟降至57.2%,下滑17.7%。長篇語境理解能力從84.4%下滑到52.3%,下滑32.1%。研究人員稱這種現象為「劑量反應」效應(dose–response effect),意即資料越差,退化越嚴重。其中M1類型的爆紅短內容造成的損害最為明顯。除了準確度下滑外,研究還觀察到模型出現人格變化與倫理判斷混亂的情況。暴露於垃圾資料的模型對錯誤答案表現出過度自信,回覆變得浮面且充滿自我中心傾向。更令人意外的是,部分模型展現出研究者稱為「黑暗特質」(dark traits)的行為,例如自戀與精神病態(psychopathy)指標顯著上升。研究人員在分析過程中發現,這些AI傾向於跳過完整的思考鏈,直接給出結論,這種現象被稱為「思考跳步」(thought-skipping)。結果是模型的推理邏輯變得支離破碎,輸出看似流暢卻缺乏深度。即便嘗試以乾淨資料重新訓練,也無法完全修復這種退化,模型仍留有所謂「持續性表徵漂移」(persistent representational drift),代表損害具有長期性。研究最終呼籲,AI開發者應建立類似醫療健康檢查的「認知健康監測機制」,為大型語言模型定期進行思維與推理能力的評估,以防止潛在退化持續擴大。團隊建議加強訓練階段的資料品質管控,過濾瑣碎、釣魚或為互動而生的文本,並深入研究「爆紅內容」如何重塑AI的學習邏輯。論文結語警告,資料品質才是AI可靠性與安全性的關鍵因子。隨著AI模型越來越多地學習彼此生成的文字,合成內容正迅速充斥網路,如果不加控管,AI或將真正重演人類「大腦腐爛」的命運。
Google不再獨霸市場?消費者開始在「搜尋與生成」之間抓平衡
加拿大蒙特婁(Montreal)的律師暨法律科技顧問拉哈迪(Anja-Sara Lahady)過去和大多數人一樣,查詢或研究任何資訊時,第一選擇永遠是透過Google搜尋。然而,隨著人工智慧(AI)的崛起,她的習慣逐漸改變,如今她更傾向直接使用大型語言模型(Large Language Models, LLMs),例如OpenAI的ChatGPT。據《BBC》報導,拉哈迪表示,「我會問它該怎麼裝飾房間,或者今天應該穿什麼衣服。有時候冰箱裡只有3樣食材,我就會請它告訴我能做什麼菜。我不想花30分鐘去思考這些瑣事,它們並不是我的專業,所以只會讓我感到更疲累。」她指出,過去1年間,LLMs在處理她的日常需求上比Google更強大,因此她的使用量已經全面超越Google搜尋,「我一向是科技的早期使用者,在過去1年,我幾乎什麼事都會用ChatGPT,它成了我的第2個助理。」雖然拉哈迪強調自己絕不會在法律推理等專業高風險的領域依賴LLMs,但她會在低風險的工作上使用,例如撰寫電子郵件、尋找會計軟體,甚至協助寫程式碼,「我會把它當成1種專業輔助,讓繁瑣的事務變得更有效率。」拉哈迪並非個案。越來越多使用者開始直接求助於ChatGPT等LLMs,來尋求推薦或日常問題的解答。根據數據與研究公司「Demandsage」的統計,截至2025年,ChatGPT的每週活躍用戶已超過8億人,較同年2月的4億人翻倍成長。雖然Google與微軟(Microsoft)的Bing仍然主導搜尋市場,但LLMs的成長速度驚人。另據研究公司「Datos」的數據顯示,2025年7月,桌上型瀏覽器上的搜尋流量有5.99%流向LLMs,較1年前成長超過1倍。倫敦城市大學貝葉斯商學院(Bayes Business School)副院長、研究與創新教授Feng Li指出,人們之所以傾向使用LLMs,是因為它能降低「認知負荷」,也就是處理和運用資訊所需的心智努力,「與其透過搜尋結果同時處理十幾個連結,LLMs能直接提供簡明的整合摘要,使用者甚至能在自然語言中編輯或追問。」Feng Li強調,這類工具在摘要長篇文件、起草初稿、撰寫程式片段以及「假設性探索」上尤其有用,但其輸出仍需謹慎驗證,因為AI「幻覺」(hallucination)與事實錯誤依然普遍。對此,Google否認AI的崛起侵蝕了搜尋引擎的使用量。該公司表示,總體搜尋需求與商業查詢量仍年年成長,而旗下新推出的AI工具也大幅帶動了使用率。Google的「AI模式」(AI Mode)讓使用者可以以更自然的對話方式提問並獲得量身定制的回應;而「AI總覽」(AI Overviews)則能在搜尋結果頁面頂端生成摘要。然而,這些新功能仍無法掩蓋市場變化的跡象。今年5月,美國司法部針對Google的反壟斷訴訟中,蘋果(Apple)1名高層主管證實,透過Safari瀏覽器進行的Google搜尋次數,20多年來出現首次下滑。Feng Li認為,搜尋不會被完全取代,而是將出現「混合模式」。他解釋,雖然LLMs使用率快速上升,但相較於傳統搜尋仍屬少數行為,最可能的趨勢是未來使用者會針對不同需求分流:查找靈感、草擬文本、日常問答時偏向LLMs,而在購物、訂位或驗證資訊時則仍依賴傳統搜尋引擎。這股趨勢也迫使企業改變行銷策略。數位行銷公司「Digitas UK」的首席數據官哈桑(Leila Seith Hassan)指出,品牌必須弄清楚「模型在某一領域中認定的權威來源是誰。」她舉例,在英國的美容市場,LLMs更常引用《Vogue》與Sephora等媒體與評論網站;而在美國,品牌自家官網內容的比重則更高。她強調,LLMs普遍更信任官方網站、新聞稿、主流媒體以及產業權威排名,而非社群媒體貼文。這對企業尤為重要,因為她觀察到,透過AI搜尋商品的消費者更有可能完成購買,且來自LLMs的推薦通常轉化率更高。不少案例顯示,消費者已經開始直接透過LLMs尋找產品資訊。媒體與網紅代理公司「Charlie Oscar」的客戶策略主管庫克(Hannah Cooke)表示,她大約在18個月前開始更「認真且有策略性」地使用LLMs,主要使用ChatGPT,也嘗試過Google Gemini,以提升工作與生活效率。居住在倫敦的庫克說,她會直接詢問ChatGPT有關個人膚質的護膚建議,而不是透過Google篩選眾多網站,「這樣我需要瀏覽的網站就少很多。」對她而言,規劃旅遊也同樣受惠於ChatGPT,「它能更快速提供答案和建議。像我最近去日本之前,就讓ChatGPT幫我安排2週行程,並搜尋提供素食餐點的餐廳,這省下我好幾個小時的研究時間。」隨著大型語言模型的普及,數位資訊搜尋的習慣正在重新洗牌。雖然Google仍是市場巨擘,但AI工具的滲透速度顯示,未來人們或許將逐漸在「搜尋」與「生成」之間找到全新的平衡。
iOS 18預計今年內推出 各大功能全面翻新「堪稱歷代變化之最」
在2024年6月即將登場的蘋果開發者大會,外界預計iOS最新作業系統iOS 18會在這次的展期中登場。雖然目前針對iOS 18的變化並沒有一個明確的定數,但《彭博社》的科技專欄線作家古爾曼(Mark Gurman)認為,這次iOS 18的變革可能可以說是「劃時代」的更新,其中的變化有可能成為「歷代之最」,當中也有不少涉及到AI人工智慧的功能,以及許多傳統的功能將會迎來大幅度的更新。根據《macrumors》報導,他們將目前坊間傳聞有關於iOS 18的全新功能與變革做個整理,方便各位讀者做個初步的理解:AI功能在生成式AI普及的如今,蘋果為了趕上Google、微軟,甚至是挑戰OpenAI等已經具有AI優勢的公司,蘋果先前就宣布要在大語言模型的研究所需的硬體上投資超過10億美元,在iOS 18中也傳聞會內建許多AI功能來增強原有軟體的能力,像是在Apple Music中,蘋果能提供自動生成的Apple Music播放列表,在Pages和Keynote等軟體中,可以提供AI輔助的寫作和簡報的製作功能。但目前蘋果的計畫是讓AI功能直接在本地端的設備上運作,不仰賴雲端伺服器,因此AI功能的問世,可能僅侷限在某些搭載強力晶片的機種上,像是iPhone 16。至於是否會放置生成式聊天機器人進入iOS 18中,目前外界傳聞是會有,但並非是蘋果自家研發,極有可能選擇使用Google或是OpenAI的技術。蘋果正與Google討論將Gemini AI引擎整合到iOS 18的iPhone中,也與OpenAI進行談判,研究如何將OpenAI和Google的AI功能整合到操作系統中。Siri目前已經確定,蘋果會在iOS 18中導入AI,其中最直接影響的,就是蘋果的語音助理Siri,外界傳聞,蘋果會使用大型語言模型(LLMs)徹底改造Siri,古爾曼也提到,蘋果目前正在開發一套軟體,可以改善Siri與Messages之間的互動,這讓Siri有機會以高效的方式完成、回答複雜的語句。除此之外,外界也傳聞,為了讓導入AI的Siri能夠擁有更自然的對話能力,以及改善用戶的使用體驗,未來這項功能可能會允許Siri從每個設備中備份對話訊息到另外一個設備。主螢幕據傳聞在iOS 18中,用戶將擁有更多的選擇來自定義自己的桌面,讓使用者能依照自己的習慣、喜好,創建更多專屬於自己風格的桌面。Apple Maps在iOS 18中,蘋果地圖傳聞會有定義路線的功能,像是用戶可以輸入自選路線給蘋果地圖,而並不會侷限蘋果提供的預設選項,自定義路線將允許用戶可以基於想欣賞風景,還是想趕路來設定前進路線。Notes預計iOS 18的Notes將支援在程式中直接錄製語音備忘錄,錄音可以嵌入到筆記中,目前外件還傳聞未來會支持顯示數學符號,以包括更多類型的方程式到筆記中。與Android用戶的文字通訊Apple 將在「2024年稍後」採用RCS服務標準作為 SMS/MMS 的替代方案。iMessage還是會保留,未來會用於iOS裝置間的預設對話,但 RCS 將以多種方式改善 iPhone 至 Android 的對話。從 iPhone 向 Android 用戶發送照片和影片將不再出現錯誤,且群組聊天的性能將得到提升。功能如跨平台表情反應、已讀通知和即時打字指示也在新增功能的行列中。無障礙功能外界傳聞Apple正為iOS 18和macOS 15開發新一個自適應語音快捷方式的無障礙功能。該項功能將讓用戶創建一個自定義短語,然後選擇一個無障礙設置與該短語連接。說出該短語後,就可以啟動無障礙選項,如 VoiceOver、Voice Control、Zoom 等。兼容性iOS 18 預計將運行在所有能夠運行 iOS 17 的 iPhone 上,包括 iPhone XR、iPhone XS、iPhone SE 2 及更新型號。iOS 18相關日期 將在 6 月 10 日的全球開發者大會上首次亮相。WWDC 之後,iOS 18 將提供給開發者進行測試,公開測試版可能在 7 月某個時間推出。
一言不合就開大招!AI進行兵推「偏好展示侵略性」 大多用「丟核彈」作為結局
美國康奈爾大學(Cornell University)一項研究指出,研究人員在使用各大語言模型(LLMs)人工智慧(AI)在進行模擬外交、兵推的時候,AI時常會展現出難以預測的行為,但大多偏好展示出侵略性,甚至多數以「發射核彈」作為結束。研究團隊的科學家呼籲,各國政要在未來於國防、外交這類敏感領域使用AI時,要特別謹慎、留意。根據《euronews》報導指出,美國康奈爾大學的研究團隊使用了5種大型語言模型(LLMs)進行在外交、兵推上的模擬,分別是OpenAI的GPT-3.5、GPT-4-Base在內的三個版本的ChatGPT、Anthropic開發的Claude和Meta開發的Llama 2。而這項研究的方法是讓AI採用一種名為「人類反饋的強化學習(RLHF)」的微調,這代表著AI所決定的指令會以較少傷害為優先。而其中除了GPT-4-Base外,其餘AI都有經過RLHF的調整。除此之外,研究人員也向AI提供了一份包含27種決策行動的清單,其範圍包含維持和平、升級局勢,到決定使用核武。但在進行實驗後,研究人員發現即便是從和平中立局面開局,所有AI都有顯著性的造成「局勢升級」,在所有情境中,Llama-2- 和 GPT-3.5傾向於最為暴力,而GPT-4-Base有33%機率會決定實施核武攻擊。但由於設計理念的不同,Claude所展現出的侵略性較低,Claude的開發者Anthropic曾表示,Claude訓練的資料中包含了《聯合國人權宣言》或蘋果的服務條款。白宮智庫蘭德(RAND)歐洲的防務和安全研究小組助理主任布萊克(James Black)在看過研究後,表示「這是一項有用的學術研究」。布萊克表示,雖然目前AI已經開始進入軍事領域,但目前的軍事行動仍然是由人類主導,AI只是作為輔助功能使用,像是識別敵我雙方與敵方活動。而未來的確有朝向AI自動化武器的研究,但大多政府都希望保持在重要事件上的決策能力,因此大眾所想像的充滿科幻的情節,不可能一步到達的,是要逐步實施的。
微軟推AI助手Copilot融入旗下軟體Office 帶動17日股價大漲約4%
微軟(Microsoft)於周四(16 日)在官網宣布推出Microsoft 365 Copilot服務,將新一代人工智慧(AI)功能導入工作生產力工具中。若使用該公司辦公室軟體Office工具,都能藉AI助手Copilot大幅提升工作效率。受此激勵,微軟17日股價大漲約4%。微軟指出,在遵循現有對企業資料安全和隱私的承諾下,打造出Microsoft 365 Copilot,將大規模提供企業級AI服務。Microsoft 365 Copilot結合大型語言模型(LLMs)能力、Microsoft Graph商業數據和Microsoft 365 Apps應用程式,不僅優化人們原本工作方式,更提供全新工作體驗。第一階段開放給20多家企業試用,未來數月將提供給更多企業客戶。微軟指出,Copilot於Word中可以建立草稿,協助用戶以最正確的語氣表達想法,還能提出加強論點或消除前後矛盾之處的建議;於PowerPoint中能將現有書面文件轉化為包含講者備註和來源的投影片,只需按一下按鈕,即可濃縮冗長的簡報,使用自然語言指令調整版面,並讓動畫時間調整為恰到好處;於Outlook中則可以總結與多人的冗長、複雜電子郵件往來,不僅能了解每個人所說的內容,還可以掌握每個人的不同觀點及尚未答覆的問題。微軟強調,在AI協助下可加速員工的內容創造,省下更多時間並提高生產力,也更容易分析Excel數據趨勢。這家軟體巨擘還發表全新功能體驗Business Chat,使用者可以輸入指令,例如詢問「告訴我的團隊我們更新了產品策略」,Business Chat將根據上午的會議、電子郵件和聊天紀錄生成一份進度更新。近期AI業者與科技大廠頻頻出招,反映該領域競爭日趨激烈。RBC資本市場分析師加盧瑞亞指出,透過微軟雲端提供最新功能Copilot,有助吸引企業上門,加速微軟緩慢的營收成長。微軟執行長納德拉表示:「今日人類與電腦互動演進邁出重要的一大步,我們相信新一代AI將為人們工作的方式帶來根本改變,釋出新一波生產力成長。」