![alt](https://static.ctwant.com/images/cover/67/342467/sm-f43b0631ffa69e7a8b1e5e7b14855243.jpg)
蘋果WWDC大會11日凌晨登場 分析師:「不再是AI落後者」但表現難突破
萬衆期待的蘋果(Apple)第35屆全球開發者大會(WWDC)終於來了,將在台灣時間6月11日凌晨1點登場,預計將推出一系列搭載人工智慧(AI)功能的新產品與服務。根據知情人士透露,蘋果自家AI系統命名為「Apple Intelligence」,未來也將應用於iPhone、iPad及Mac中。今年3月,蘋果的營銷主管Greg Joswiak在X上預告,「今年的WWDC將是絕對不可思議的(Absolutely Incredible)!」而這2個單字的字首,已經暗示此次WWDC大會的主題為AI。外媒知名科技記者Mark Gurman也透露,蘋果不打算在今年的WWDC大會上發布任何新產品,而將重點放在即將推出的軟體更新,意味著可以期待關於iOS 18、iPadOS 18、macOS 15、tvOS 18、watchOS 11和visionOS 2等一系列軟體更新,且將聚焦在「AI」。Mark Gurman也補充,WWDC 2024的亮點將是Siri全新AI版本,提升其智能性。一直以來,多數iPhone用戶只會用Siri設鬧鐘或在Spotify上播放歌曲,並不會將它視為助手,不過未來Siri有望可爲用戶提供一切服務,包含主動提供建議、編輯照片,到隨時回應用戶的任意問題。究竟這款更智能的Siri是由誰提供技術支持?根據多家外媒報道,蘋果與OpenAI針對其GPT軟體授權進行討論、協商,也與Google旗下Gemini軟體的授權進行單獨談判。從去年開始,在席捲全球的AI浪潮中,輝達(NVIDIA)、微軟(Microsoft)、Google等衆多科技巨頭出盡風頭,而蘋果股價僅上漲6%左右,在「美股七巨頭」中明顯跟不上。不過知名分析師郭明錤猜測,在WWDC結束後,蘋果將不再被視爲AI行業的落後者,AI將在蘋果主要的應用中無所不在,蘋果的用戶界面設計優勢將充分展現,包含Siri的改善是最大賣點之一。但是他不認爲蘋果已經取得超出市場預期的突破性進展,對於即將在秋季發布的iPhone新機型及配套操作系統能否引發用戶換機潮,郭明錤也持懷疑態度。
![alt](https://static.ctwant.com/images/cover/47/340647/sm-a3aa231192ff1fc7849639fd24644302.jpg)
蘋果股價小漲仍落後大盤 外媒:重押Siri全面AI升級劍指亞馬遜谷歌
蘋果(AAPL)股價1日小漲0.54%來到192.32美元,昨收盤價為192.48美元,據外媒報導,蘋果將對Siri進行全面AI化升級,已和ChatGPT母公司 OpenAI達成初步合作協議,將聊天機器人和其他技術整合到iOS操作系統中,凸顯蘋果重押在Siri、全力進軍AI領域的一項重要指標,並預計在6月10日全球開發者大會(WWDC)上公布相關戰略策略。據悉,蘋果仍在與Google母公司Alphabet Inc.就未來使用其Gemini談判。由於日前傳出蘋果產品銷售業績放緩等消息後,2024年以來股價表現雖有上漲了約3%,仍落後以科技股爲主的納斯達克100指數上漲的12%。而根據蘋果內部消息傳出,研發團隊將在操作系統更新中多加開發新的AI功能,對於iPhone、iPad和Mac的新人工智能功能,強化Siri功能等,鼓勵用戶升級設備同時,帶動iPhone 15 Pro或更高版本市占率;Mac、iPad則還需要一個M1晶片。根據外媒報導消息人士指出,蘋果欲聚焦人工智能AI升級技術等層面上,對Siri全面升級,將是WWDC的一個關鍵焦點,進一步搶占亞馬遜Alexa、谷歌Google助理等的市占率,主要是讓用戶能夠用聲音控制各個應用程序功能,為今年蘋果更深化人工智能戰略一部分,預計在6月10日全球開發者大會(WWDC)上公佈。蘋果也正在著手包括語音備忘錄轉錄和摘要、網站和通知的快速回顧、自動消息回覆、照片編輯和人工智能生成的表情符號等功能升級。Siri升級AI化的新系統也將透過Siri,更精確地控制iPhone或iPad,包括能夠打開單獨的文檔,將筆記移動到另一個文件夾,發送或刪除電子郵件,打開Apple News中的特定出版物,通過電子郵件發送網頁鏈接,甚至要求設備提供文章摘要,更進一步使用人工智能來分析用戶的使用行為,自動啓用Siri控制功能。由於更爲複雜,預估最快到2025年公布,屆時將成爲iOS 18後續更新的一部分。新操作系統的第一個版本將於9月發佈,大約與下一代iPhone機型同時發佈。
![alt](https://static.ctwant.com/images/cover/75/339575/sm-9db99c946e267de3611a32e2d8aa990e.jpg)
蘋果WWDC大會6/10主打AI 外媒:iOS 18將引入
蘋果公司全球開發者大會(WWDC)將於6月10日舉行。彭博知名記者古爾曼(Mark Gurman)報導稱,蘋果已與OpenAI達成協議,將為今年的iOS 18系統提供一系列生成式AI功能,且蘋果在WWDC會上將花很大篇幅介紹其AI工具。報導指出,蘋果已與OpenAI達成協議,將其聊天機械人ChatGPT引入到iOS 18,預計將在WWDC上宣布,屆時蘋果公司據稱還將發布改進後的Siri語音助理。不過由於OpenAI的公司架構和管理層不穩,蘋果也希望「不要把所有的雞蛋放在一個籃子裡」,該公司努力與Google達成協議,試圖將Gemini作為另一種可選擇的方案內置在iOS系統中。此外,蘋果即將推出的iOS 18和macOS 15將加入AI功能,用戶可在兩個系統中應用核心AI工具Project Greymatter,基本上可完全在設備上處理,如果需要更多AI運算能力,則會推送至雲端,系統會自行判斷處理方式。同時,Project Greymatter將會整合到Safari、Photos和Notes核心應用和部分操作系統。先前有消息稱,蘋果正在開發自己的AI模型,用於設備上的文字分析、智慧回覆和摘要。因此,ChatGPT和其他OpenAI技術將用於分析較長的文字、影像生成以及類似的高要求任務。古爾曼也總結了蘋果即將在iOS18中推出的多款AI功能,今年推出的功能涉及語音轉備忘錄、AI修圖、Spotlight搜尋優化、Safari網頁搜尋改進、自動建議電子郵件或短信回覆,以及智能生成摘要等。
![alt](https://static.ctwant.com/images/cover/79/337679/sm-9a6cd926dfabfcf582400a8e76637351.jpg)
AI圈百花齊放!微軟5/21放大招 外媒猜有「這3大」亮點
從OpenAI最新發布的GPT-4o多模態模型,到谷歌I/O大會上Gemini一系列亮眼升級和AI助手Project Astra,AI圈百花齊放的產品競賽還沒結束。另一大AI巨頭微軟(Microsoft)將於當地時間5月21日,在西雅圖舉辦Build 2024年度開發者大會,被視為微軟闡釋其戰略規劃,和展示最新AI產品的重要舞臺。毫無疑問,AI將繼續成為本次Build大會的主角。微軟對主題演講活動的描述也強調,這次大會的重點是了解人工智慧時代將如何釋放新機遇、改變開發人員的工作方式,並推動各行業的生產力。考慮到這是一場針對開發者的大會,應該會發布許多針對開發者的產品更新,例如GitHub、Fabric、Azure AI和Azure DevOps。此外,綜合國外多家科技媒體的推測,微軟本次有望發佈面向消費者的AI PC、新的Windows系統、更強大的Copilots等產品。微軟今年3月份推出了性能強大、帶有專用神經處理單元以更好支持AI任務的Surface電腦,不過3月發佈的設備均為企業版。下週微軟可能會更新專供消費者的產品線,預計也會配備新型Intel Core Ultra(5或7)處理器和專用神經處理單元。這將是微軟首次推出面向消費者的基於人工智慧技術驅動的Surface產品。另,預計微軟將發佈全新增強版Windows操作系統,進一步整合其內部AI功能。有媒體曾爆料,微軟正打造一個名為AI Explorer的基於機器學習技術的新功能,可能會改進Windows上的搜索工具,允許用戶使用自然語言輸入查找從網站到文件等各種內容,可能還會有一個新的時間軸,讓用戶可以回溯他們最近在電腦上的所有操作,並且根據他們當前正在查看的內容提供上下文建議。此外,基於此前已經曝光的Copilot功能基礎,微軟可能會添加對即時字幕、強化圖片編輯(包括即時濾鏡)等工具的支持。有媒體還推測,微軟Copilot工具現在最顯著的缺點,就是依賴網路連接,無法執行邊緣計算。但此前英特爾已經證實,微軟正在尋找以邊緣計算驅動Copilots的方式,以使AI助手能夠更快回答如基本數學、系統文件查詢之類的簡單問題。Build 2024將是微軟人工智能技術實力的一次重大檢閱。如果微軟能夠令人信服地證明其AI產品的價值、可靠性和實用性,將進一步鞏固其在這一賽道上的領先地位。
![alt](https://static.ctwant.com/images/cover/37/336937/sm-902b91122e2857a18bf44b79dfbc3e6a.png)
Google I/O 大會登場 全新AI模型、傳統服務大進化成全場焦點
Google年度開發者大會「Google I/O」於台灣時間15日凌晨1點登場。而今年承襲去年的AI熱潮,將重點放在AI上面,不僅公布了全新的AI模型Gemini 1.5 Pro,同時其餘內容也是圍繞在Gemini與其他服務之間的應用。至於往年的重點「Android系統」,則是放到次日才會介紹,可以說是相當罕見。在這次的Google I/O大會中,Google官方推出全新的AI模型Gemini 1.5 Flash,同時還升級了現有的AI模型Gemini 1.5 Pro。Google DeepMind的CEO哈薩比斯(Demis Hassabis)解釋,Gemini 1.5 Flash是基於Gemini 1.5 Pro所開發出來的輕量化AI模型,但是功能上並不會差異太大,因為其中使用到「知識蒸餾(Knowledge distillation)」的技術,將Gemini 1.5 Pro的核心知識轉移到Gemini 1.5 Flash中,也因為Gemini 1.5 Flash比較輕巧的關係,執行速度上也會比Gemini 1.5 Pro還要快速。Google官方甚至提到,Gemini 1.5 Flash有足以分析1500頁文件或是超過3萬行程式碼的能力。而在Gemini 1.5 Pro方面,雖然這是2月份就早已推出的產品,但是在這次開發者大會上,官方宣布Gemini 1.5 Pro也獲得了提升,Google強化了Gemini 1.5 Pro在編寫程式、推理、解析聲音、圖像方面的能力。而官方也將Gemini 1.5 Pro的Token提升至200萬個,這也讓他能夠同時處理的資訊足以大為提升,其中可以同時處理超過2小時的影片、22小時的聲音、超過140萬字的文字或是6萬行的程式碼。除了公布新開發的模型外,Google也在這次宣布許多傳統既有功能與AI模型結合後的變化,其中包含了搜尋引擎、Google相簿、Gmail、Google雲端硬碟等服務,這些服務都新增了一個「Gemini AI側邊欄」的功能。「Gemini AI側邊欄」其實就是一個內含AI模型的對話框,用戶可以透過交談的方式,交付AI一些尋找、整理、分析的工作。像是可以在Gmail中,請Gemini AI依據寄件人、日期等條件,幫信箱中的信件進行分類。又或者是請它幫忙撰寫回信、抓出信件重點。(圖/翻攝自YouTube)如果是在Google相簿中,甚至可以透過「Gemini AI側邊欄」,要求他幫忙找出符合特定條件的照片,比如「帶有車牌的照片」,甚至是更抽象的回憶問題,你可以向「Gemini AI側邊欄」描述你的回憶,它會想辦法從你的相簿中找尋到相對應的照片。除了AI模型與傳統功能的結合外,Google官方也公布了多模型AI技術專案「Project Astra」,這項專案主要是讓AI進入到眼鏡、手機當中,之後透過鏡頭來捕捉畫面,即時性的解答用戶的問題,比如協助使用者來分辨眼前的事物,甚至是對眼前的畫面進行生動的描述。(圖/翻攝自YouTube)
![alt](https://static.ctwant.com/images/cover/16/336116/sm-f97c11d7195e9e2b704c3d968f5846ac.jpg)
iPhone也要ChatGPT? 彭博:蘋果將與OpenAI達成協議
據彭博報導,蘋果將與新創公司OpenAI達成協議,將ChatGPT應用於IPhone。知情人士表示,雙方一直在敲定一項協議的條款,以便在下一代iPhone操作系統iOS 18中使用ChatGPT功能。蘋果還與谷歌就授權該公司的Gemini聊天機器人進行了談判。這些討論尚未達成協議,但仍在進行中。與OpenAI的協議將讓蘋果提供一個受歡迎的AI服務,作為蘋果計劃下個月宣佈的一系列新AI功能的一部分。外媒今年4月報導稱,蘋果與OpenAI的討論已經加強。不過,保證協議可能不會很快就會宣佈。蘋果計劃在今年6月舉行一年一度的全球開發者大會時,屆時可能在AI領域引起轟動。作為推動AI的一部分,該公司將通過配備自己內部處理器的數據中心運行一些即將推出的AI功能。去年,蘋果執行長庫克曾表示,他個人使用OpenAI的ChatGPT,但補充道有些問題需要解決。並承諾新的人工智慧功能將在非常周到的基礎上進入蘋果的產品。在上週的蘋果收益電話會議上,他認為蘋果將在人工智能領域佔據優勢。
![alt](https://static.ctwant.com/images/cover/8/333408/sm-9775b6535f5bcb87c8e5608505910f13.jpg)
iOS 18預計今年內推出 各大功能全面翻新「堪稱歷代變化之最」
在2024年6月即將登場的蘋果開發者大會,外界預計iOS最新作業系統iOS 18會在這次的展期中登場。雖然目前針對iOS 18的變化並沒有一個明確的定數,但《彭博社》的科技專欄線作家古爾曼(Mark Gurman)認為,這次iOS 18的變革可能可以說是「劃時代」的更新,其中的變化有可能成為「歷代之最」,當中也有不少涉及到AI人工智慧的功能,以及許多傳統的功能將會迎來大幅度的更新。根據《macrumors》報導,他們將目前坊間傳聞有關於iOS 18的全新功能與變革做個整理,方便各位讀者做個初步的理解:AI功能在生成式AI普及的如今,蘋果為了趕上Google、微軟,甚至是挑戰OpenAI等已經具有AI優勢的公司,蘋果先前就宣布要在大語言模型的研究所需的硬體上投資超過10億美元,在iOS 18中也傳聞會內建許多AI功能來增強原有軟體的能力,像是在Apple Music中,蘋果能提供自動生成的Apple Music播放列表,在Pages和Keynote等軟體中,可以提供AI輔助的寫作和簡報的製作功能。但目前蘋果的計畫是讓AI功能直接在本地端的設備上運作,不仰賴雲端伺服器,因此AI功能的問世,可能僅侷限在某些搭載強力晶片的機種上,像是iPhone 16。至於是否會放置生成式聊天機器人進入iOS 18中,目前外界傳聞是會有,但並非是蘋果自家研發,極有可能選擇使用Google或是OpenAI的技術。蘋果正與Google討論將Gemini AI引擎整合到iOS 18的iPhone中,也與OpenAI進行談判,研究如何將OpenAI和Google的AI功能整合到操作系統中。Siri目前已經確定,蘋果會在iOS 18中導入AI,其中最直接影響的,就是蘋果的語音助理Siri,外界傳聞,蘋果會使用大型語言模型(LLMs)徹底改造Siri,古爾曼也提到,蘋果目前正在開發一套軟體,可以改善Siri與Messages之間的互動,這讓Siri有機會以高效的方式完成、回答複雜的語句。除此之外,外界也傳聞,為了讓導入AI的Siri能夠擁有更自然的對話能力,以及改善用戶的使用體驗,未來這項功能可能會允許Siri從每個設備中備份對話訊息到另外一個設備。主螢幕據傳聞在iOS 18中,用戶將擁有更多的選擇來自定義自己的桌面,讓使用者能依照自己的習慣、喜好,創建更多專屬於自己風格的桌面。Apple Maps在iOS 18中,蘋果地圖傳聞會有定義路線的功能,像是用戶可以輸入自選路線給蘋果地圖,而並不會侷限蘋果提供的預設選項,自定義路線將允許用戶可以基於想欣賞風景,還是想趕路來設定前進路線。Notes預計iOS 18的Notes將支援在程式中直接錄製語音備忘錄,錄音可以嵌入到筆記中,目前外件還傳聞未來會支持顯示數學符號,以包括更多類型的方程式到筆記中。與Android用戶的文字通訊Apple 將在「2024年稍後」採用RCS服務標準作為 SMS/MMS 的替代方案。iMessage還是會保留,未來會用於iOS裝置間的預設對話,但 RCS 將以多種方式改善 iPhone 至 Android 的對話。從 iPhone 向 Android 用戶發送照片和影片將不再出現錯誤,且群組聊天的性能將得到提升。功能如跨平台表情反應、已讀通知和即時打字指示也在新增功能的行列中。無障礙功能外界傳聞Apple正為iOS 18和macOS 15開發新一個自適應語音快捷方式的無障礙功能。該項功能將讓用戶創建一個自定義短語,然後選擇一個無障礙設置與該短語連接。說出該短語後,就可以啟動無障礙選項,如 VoiceOver、Voice Control、Zoom 等。兼容性iOS 18 預計將運行在所有能夠運行 iOS 17 的 iPhone 上,包括 iPhone XR、iPhone XS、iPhone SE 2 及更新型號。iOS 18相關日期 將在 6 月 10 日的全球開發者大會上首次亮相。WWDC 之後,iOS 18 將提供給開發者進行測試,公開測試版可能在 7 月某個時間推出。
![alt](https://static.ctwant.com/images/cover/89/333289/sm-b2896ff7448ffdc91c07c9194c1fb373.jpg)
iPhone將引入AI功能? 傳蘋果與OpenAI和谷歌進行談話
據知情人士透露,蘋果已重啟與OpenAI的談判,打算使用這家新創公司的技術來為今年下半年推出的iPhone的一些新功能提供支持。外媒引述知情人士消息報導,兩家公司已經開始討論可能達成的協議的條款,以及OpenAI的功能將如何整合到蘋果的下一代iPhone操作系統iOS 18中。此舉標誌著兩家公司重啟對話。今年早些時候,蘋果曾與OpenAI就一項交易進行過談判,但自那以來,雙方的合作一直很少。與此同時,蘋果據稱還在與Alphabet旗下的谷歌就授權使用後者的Gemini聊天機器人進行談判。有鑑於此,不難看出蘋果還沒有最終決定將與哪家公司進行合作,也不能保證會達成協議。該公司有可能最終與OpenAI和谷歌均達成協議,或者完全選擇另一家供應商。今年早些時候還有報導稱,蘋果在與人工智慧新創公司Anthropic進行討論。蘋果準備在全球開發者大會上推出新的人工智慧軟體和服務。蘋果CEO庫克(Tim Cook)此前承諾,公司今年將在人工智慧領域取得重大突破,而即將發佈的iOS 18被認爲是實現這一目標的重要途徑之一。據了解,Siri預計將成為iOS 18人工智慧改進的受益者之一。此前有消息人士透露,蘋果計劃利用大型語言模型全面革新Siri,使其成爲「終極虛擬助手」。另有媒體報導稱,蘋果正在開發的一項具體功能是改善Siri與訊息應用的交互,例如讓Siri更有效地自動完成句子並回答覆雜問題。去年,庫克表示,他個人使用OpenAI的ChatGPT,但有許多問題需要解決。他承諾,新的人工智慧功能將在非常周到的基礎上進入蘋果的平台。有分析人士指出,依靠合作伙伴將有助於蘋果加速進軍聊天機器人領域,並避開一些風險。通過將生成式人工智慧功能外包給另一家公司,庫克可能會減輕其平台的責任。
![alt](https://static.ctwant.com/images/cover/57/330557/sm-f2a308d56bbbba37e4ceb714fc8ed9a6.jpg)
繁中守護者2/母湯是一種清湯?專家測試8萬字資料Breeze運算跑第一「OpenAI不友善」
全世界最強繁中大型語言模型LLM問世,「MR BreeXe針對中文特殊情境優化,所以速度提升1倍,布建成本下降一半。」聯發創新基地資深技術經理陳宜昌告訴CTWANT記者。目前全世界有中文參數的LLM模型,包括歐美科技業者投資OpenAI的ChatGPT、Google的Gemini,Facebook母公司Meta推出的LLaMA,中國有百度的「文心一言」等,但大多以簡體中文的內容為主。究竟聯發科推出的繁中LLM功力如何?業內專家ihower用數發部的政府報告、管理學講義共8萬多字做壓力測試,結果發現聯發科在Tokenizer (分詞器)上的調整相當「有感」。ihower表示,一樣的文本,若能用比較少的 Tokens 數來表示,推論速度會比較快、成本也會比較划算,畢竟計價也是用Tokens數計算的。「以OpenAI為基準,聯發科的Breeze大約節省50%的Tokens數、運算更快,而Google Gemini大約節省46%,Llama 2甚至比OpenAI差、多增加了20%。」「OpenAI的Tokenizer對繁體中文真的很不友善啊!」ihower說。華碩營運長暨台智雲董事長謝明傑曾表示,OpenAI模型「大部分是英文腦,中文的腦相當少」,繁體中文資料比例低於0.1%,簡體中文資料不超過2%,但以數量來說,也相當於超過繁體中文20倍的量。GPT-4在中文領域的回答仍有侷限性。(圖/記者黃耀徵攝)同樣是中文LLM,為何要另外做出繁體中文的版本?成功大學資工系教授黃敬群向CTWANT記者解釋,因為AI是「生成」,而且不斷「演化」,一般人不會知道內容出自哪裡,就會出現文化衝擊問題,「現在很多大學生的作業、學者論文,甚至是媒體報導的內容,用AI輔助後出現大量中國式用語與邏輯思維,而非台灣行之有年、大量專家學者累積並完成的知識與術語,但使用者可能都沒發現。」如果不喜歡抖音文化,可選擇不看,但在AI時代,因為資料量的差異,中文世界會整個傾斜倒向中國大陸的邏輯思維,所以聯發科做繁體中文模型時「開源」公開程式碼,讓全世界的人去使用,以台灣思維為主的中文知識,才有機會進入AI時代的大腦資料來源。聯發創新基地在台大、倫敦、劍橋都有據點,一起研究AI。(圖/翻攝自聯發創新基地官網)除了解析中文語句的速度快,陳宜昌舉例,如果用Mixtral詢問「母湯」,他會說「是一種中國傳統的食物,通常是一種清湯或魚羹。」但在BreeXe上,就會說這是「台語的諧音梗,源自於沒關係,但在網路流行語中被用來否定、或是不正確的意思。」聯發創新基地負責人許大山跟CTWANT記者說,會取名為BreeXe,除了致敬Mixtral原本「西北風」意思,也希望他像breeze一樣的徐徐微風、廣泛吹進大家的電腦裡,讓人有如沐春風的感覺。一般人可能看不見、摸不著,但是這股以科技人為首的夢想與使命的風已經悄悄吹起來了。
![alt](https://static.ctwant.com/images/cover/60/324760/sm-99e04299eb025f38e7f63c9c47c32bdd.jpg)
未來5年內可發展具同理心機器人!ChatGPT參加所有考試都能拿滿分
獲得今年教育部國家講座主持人的台大資工系講座教授傅立成(見圖)18日表示,在生成式AI問世後,機器人藉由大數據資料,已不再冰冷,變得更有溫度及人性。(圖/中國時報鄧博仁攝)生成式人工智慧(AI)的發展日新月異,獲得今年教育部國家講座主持人的台大資工系講座教授傅立成18日預估,未來5年內,科學家可以發展出具同理心、有溫度的機器人,而機器人具有人類小孩的智慧,是指日可待。教育部昨舉行國家講座、國家產學大師獎暨學術獎頒獎典禮,國家講座主持人每人可獲3年600萬元的獎助經費,產學大師獎及學術獎得主每人可獲90萬元獎金。傅立成被譽為「台灣首席機器人專家」,他36年來的研究成果均與人類生活有關,近年將AI導入社交機器人應用,並將AI技術運用於醫療與照護。傅立成說,在生成式AI問世後,機器人藉由大數據資料,已不再冰冷,可以變得更有溫度及人性。他已研究出一些機器人雛形,可以與老人熱絡互動,便於訓練長者認知能力,避免老化。傅立成引用Nvidia公司創辦人黃仁勳的話說,「到了2025年,ChatGPT參加所有考試,都可以得到滿分」,他預估,未來5年科學家將發展出具有相當同理心和溫度的機器人,而且讓他們具有小孩子的智慧。機器人未來會不會威脅到人類的生存?傅立成說,AI正在發展,他對良善的人類有信心,AI技術應該會在良善的道路上前進。獲得今年學術獎得主的陽明交大副校長周倩,是數位學習、資訊素養與倫理方面的專家,她表示,AI是時代趨勢,無法禁止,例如現在評量學生不能直接要他們交報告或讀書心得,因為報告可能是用AI做成,她反而會打入關鍵字要AI生成一些資料,然後要學生批判這些內容,以訓練學生的批判性思考。AI的運用愈來愈廣泛,美媒報導,蘋果公司專注於生成式AI項目,正與Google洽談,計畫要在iPhone內建Google旗下的AI引擎Gemini,市場預期這筆交易,可能在6月的蘋果年度「全球開發者大會」正式對外公布,不過,雙方目前尚未敲定任何協議條款,也未拍板最終該如何實施。因此,另有報導指出,6月可能還不會宣布。知情人士也透露,蘋果最近也和微軟支持的ChatGPT開發商OpenAI磋商,並考慮使用其模型。
![alt](https://static.ctwant.com/images/cover/27/324727/sm-9ed1f75f08fac6a7d8bd26c2eefd97f2.jpg)
開發生成式AI不掉隊 蘋果將推300億參數多模態大模型MM1
相較於輝達、微軟等大型科技股,蘋果今年的表現令投資人失望,股價年內跌逾10%,且失去了全球市值最高公司的寶座。原因是蘋果已在這場人工智慧(AI)競賽中落伍,為擺脫窘境,蘋果近期放棄造車項目,正在全面轉向生成式AI領域,並且很快有了新動作。蘋果公司研發團隊近日發佈了一篇論文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》,首次公佈了多模態大模型MM1,展示了該公司在AI方面的進展與實力。據悉,MM1最高參數量為300億,該模型支持增強的上下文學習和多圖像推理,在一些多模態基準測試中有較好表現。研究人員使用這些模型進行實驗,找出影響大模型表現的關鍵因素。有趣的是,圖像分辨率和圖像標籤數量比視覺語言連接器的影響更大,不同的預訓練數據集會顯著影響模型的有效性。MM1的獨特之處在於其龐大的規模和架構創新,包括密集的模型和混合專家模型。這些模型證明了研究人員方法的有效性,將大規模預訓練與戰略性數據選擇相結合,以增強模型的學習能力。研發團隊稱,MM1不僅在預訓練指標中是最先進的,並且在一系列已建立的多模態基準測試中,經過微調後也保有競爭力,可以支持增強的上下文學習和多圖像推理,使得少數樣本的思維鏈提示成為可能。然而,目前MM1的整體性能還沒有完全超過谷歌的Gemini和OpenAI的GPT-4,雖然還不是絕對的領導者,但它仍然是蘋果在AI方面的一次重大飛躍。
![alt](https://static.ctwant.com/images/cover/64/321664/sm-d97aa664b30e0f167cd4df0af2a18a53.jpg)
陳冠希出道24年獻第一次 合體老搭檔來台狂歡
「太空港」相隔5月25、26日於桃園陽光劇場登場,由陳冠希擔任先鋒領航員,以歌手出道的他入行24年至今從未在台公開演出,為了太空港特別獻出在台灣的獨家首唱,與昔日兩大音樂夥伴MC仁、廚房仔暌違9年再度合體,將共組當年叱吒香港樂壇的嘻哈天團「三角度 3 CORNERZ」,誓言要用「三角度」最嗨、最獨特的嘻哈表演風格狂炸樂迷。熱愛嘻哈文化、並致力推動香港嘻哈音樂不遺餘力的陳冠希,在2012年與兩位圈內好友MC仁及廚房仔組成嘻哈限定團「三角度 3 CORNERZ」,當中兩位團員皆是亞洲跨音樂及潮流藝術的佼佼者,其中MC仁不僅從事藝術策展及裝置設計及塗鴉CEA香港站的創始人,更在說唱集團LMF擔任唱和作詞,推動嘻哈文化貢獻良多的他更被頒發終身成就嘻哈獎。而廚房仔則是擅長霹靂舞及MC,三人所組成的「三角度 3 CORNERZ」堪稱嘻哈界黃金組合。值得一提的是,陳冠希早年憑藉著多張經典大碟《Please Steal This Album 》、《Hazy: The 144 Hour Project》獲獎無數,當年不僅是港台兩地嘻哈音樂的先鋒,更成亞洲級家喻戶曉的潮流歌手,加上自身品味成功跨足潮牌藝術界,讓「冠希潮流宇宙」席捲亞洲各地。而這期間秉持著對音樂的熱愛,陳冠希更突破框架積極與世界各地音樂人合作,持續為自己音樂及藝術領域張壯大。太空港除了邀請陳冠希擔任首日壓軸演出之外,更一次網羅韓國新銳嘻哈歌手,包括曾來台參加《太空港:遊戲開始》的嘻哈新秀Gemini,以及嘻哈選秀節目《Show Me TheMoney》第11屆季軍BLASÉ,其中擁有190公分身高的BLASÉ不僅高人一等,更與李泳知、Jay Park等大咖合作單曲,可說備受矚目。韓國嘻哈新秀BLASÉ曾與李泳知、Jay Park合作單曲。(圖/Mercury Entertainment提供)另外,曾為Jay Park、孝琳、2NE1成員Minzy及Block B小分隊BASTERZ 等大咖寫過歌的頂級製作雙人組「GroovyRoom」,身兼DJ、AT AREA廠牌創辦人的他們因多元曲風及超強創作功力圈粉無數,更連續兩年在 KOREAN HIPHOP AWARDS 中榮獲「年度最佳製作人」獎項,去年底曾來台參加活動的他們讓台迷見識到現場饒舌功力,今年獲太空港主辦之邀有機會來台與粉絲近距離接觸,「GroovyRoom 」表示:「很期待再次感受歌迷們的熱情!」韓國製作雙人組GroovyRoom將在太空港演出。(圖/Mercury Entertainment提供)
![alt](https://static.ctwant.com/images/cover/56/320556/sm-0d0276db364166af0457e4aed81ac698.jpg)
Sora來襲1/OpenAI新殺手鐧「文字轉影片」 馬斯克:「gg humans」動畫廣告業恐受創
不出手則已,一出手就是橫掃市場!OpenAI繼2022年11月底發表文字生成式AI「ChatGPT」,相隔才短短15個月,2月16日又推出影片生成AI模型「Sora」,一舉將AI應用從文字升級到影片,立馬驚艷全球,市場甚至對一分鐘以內短影片的動畫及廣告產業,湧現唱衰聲浪。對於「Sora」的橫空出世,有網友在推特上發文,「gg Pixar(皮克斯動畫工作室)」,而特斯拉執行長馬斯克更直接回文表示,「gg humans」(意指AI將取代人類)。而就在OpenAI發布「Sora」的前幾個小時,Google也在15日發表了最新的Gemini 1.5模型,可一次處理大量資訊,包括1小時的影片,不過經過網友們的測試,Gemini 1.5最後生成的產品一定都會「種族多元化」,遭到 Google暫時下架。其實在2023年,也有數個影像生成軟體出現,包括RUNWAY Gen-2在6月推出,11月又有Stable Video Diffusion、Pika等模型推出,不過這些模型的影片生成能力,大多僅約3、4秒左右,最長不超過10秒。而OpenAI的「Sora」一亮相,就立刻震撼全市場。「Sora 是一個AI模型,可根據文字指令創建現實且富有想像的場景,產生長達一分鐘的視頻,同時保持視覺品質並遵守用戶的提示。」也就是說,只要輸入「Prompt(提示)」文字敘述下指令,Sora就可以生成最長約1分鐘的真實度不低的影片。OpenAI展示數十個由Sora所生成的影片,內容擬真度極高,像是「一名穿著時尚的女子走在充滿溫暖霓虹燈及招牌的東京街頭。她身著黑色皮夾克、紅色長裙及黑色靴子,拎著一個黑色包包,戴著太陽眼鏡,擦著紅色口紅,走起路來自信又隨性。潮濕的街道反射出七彩燈光,行人熙來攘往。」但影片也出現謬誤,例如「一個人在跑步機上跑步的場景,以35毫米拍攝的電影膠片。跑者卻是逆向在跑步機上跑步。」一般認為,包括分鏡師在內的影像從業人員將受到最大的衝擊。圖為錄影示意圖。(圖/翻攝自GoodSpace.好空間網站)對此,OpenAI解釋,「我們正在教授人工智慧理解和模擬運動中的物理世界,目標是訓練模型幫助人們解決需要現實世界互動的問題。」「現實的物理原理及因果關係,仍是Sora最大的問題所在。」儘管仍不盡完美,「相較於之前的影片生成AI,幾乎是小學生對於比大學生。」有Youtuber如此形容。M觀點主持人Mulia認為,「Sora」的出現,勢必嚴重衝擊動畫及廣告產業,尤其廣告,一般頂多就是30秒左右,剛好就是「Sora」可處理的長度,他甚至預期,5年後,也許小說家可透過ChatGPT,將小說內容生成劇本,再透過Sora生成一小時影片。知識力科技執行長曲建仲指出,目前OpenAI對於原理公開並不多,基本上就是使用了「變換模型(Transformer model)」及「擴散模型(Diffusion model)」來對影片結構做了全面創新。擴散模型(Diffusion model)是將真實圖片逐漸加入雜訊(Noise),讓圖片慢慢變成完全的雜訊圖片,再反轉這個過程,逐漸去除雜訊(Denoise),讓圖片回復為原來的樣子,叫做反向過程(Reverse process)。「ChatGPT利用token(類似單詞的文字語意)來進行文字接龍,產生連續且具有意義的句子及文章,Sora就是利用圖片版的token也就是Patch,來創造出具有連貫性的圖片。」Youtube頻道泛科學院解釋道。「這也是AI變成人的里程碑。」對於Sora的出現,「Sora對於動畫產業的影響,並非是全面衝擊,反而應該要這樣來看,畢竟AI的內容基礎,還是由照片來生成,也就是說,如果是紀實類的影片,例如人物類,由於AI已經很容易收集到相關內容所需資料,影響程度就會比較大,至於是創作型的影片,那Sora反倒是一個不錯的工具。」動畫導演蕭永生告訴CTWANT記者說。知識力科技執行長曲建仲指出,OpenAI基本上就是使用了「變換模型(Transformer model)」及「擴散模型(Diffusion model)」來對影片結構做了全面創新。(圖/翻攝自曲博科技教室臉書、翻攝自魔法學院官網 )Youtube頻道中二見習中製作人Raymond表示,很多影片在正式拍攝之前,都會有分鏡師先進行分鏡,最後再由導演來決定如何拍攝,Sora的出現,對於分鏡的作業將會有明顯的衝擊,但是對於編劇及導演來說,則是一個很好用的工具。「對於很多講述性質的Youtube頻道來說,Sora可以生成很多不同段的影片,讓他們的影片更加豐富。」至於Sora需要多少的算力,來生成一則長度約60秒的影片?目前在論壇Reddit就有網友在討論,也有引用到外媒《Wired》的報導,推估,Sora生成一個1分鐘長度的影片,認為大約需要一個小時。這也說明了目前Sora並沒有開放給一般民眾使用,而是僅給OpenAI內部及部分的動畫家、導演等來測試。而Sora何時會像ChatGPT一樣普及?目前OpenAI並沒有時間表。OpenAI正在跟「錯誤訊息、仇恨內容和偏見等領域的領域專家」對模型進行對抗性測試,另外也在建立工具來幫助偵測誤導性內容,例如偵測分類器,以判斷Sora何時產生影片。
![alt](https://static.ctwant.com/images/cover/25/317625/sm-27b7633f7aa3b33b67c94fa161a4a5e9.jpg)
年收入逾20億! 外媒:OpenAI躋身增長最快矽谷公司行列
據金融時報報導,人工智慧研究公司OpenAI的年收入可能已經超過20億美元,躋身於歷史成長最快的科技公司之列。知情人士透露,這家新創公司在12月實現 20 億美元營收里程碑;他們還表示,在商業客戶對生成式人工智慧產生濃厚興趣的背景下,到2025年這個數字可以增加一倍以上。根據《Information》先前報導,由於ChatGPT產品的強勁成長,該公司12月年化收入突破16億美元,高於10月中旬的13億美元。這一增速將使2015年成立的OpenAI可以躋身谷歌、Meta等少數幾家矽谷公司之列。雖然公司去年11月發生了「人事大地震」,但首席執行長奧特曼(Sam Altman)在被董事會罷免後的幾天內就恢復了職務,對公司業務的影響幾乎可以忽略不計。奧特曼曾宣稱,截至2023年11月,92%的財富500強公司都在使用OpenAI的產品,包括ChatGPT及其底層AI模型GPT-4,而這個聊天機器人每週也同樣擁有1億用戶。OpenAI的許多競爭對手,包括谷歌、Meta等大型科技公司,以及Anthropic、Mistral等新創公司也都在積極將AI產品商業化。近日,谷歌推出了Gemini Advanced,使用的是谷歌此前已公佈過的對標GPT-4的Gemini Ultra模型。奧特曼曾表示,由於構建和運行模型的巨額成本,OpenAI仍然處於虧損狀態。隨著該公司開發更復雜的模型,預計支出將繼續超過收入。為了支付這些成本,該公司可能需要再融資數百億美元。為了獲得資金,OpenAI幾個月前曾尋求以860億美元的公司估值出售股份,這一數字大約是去年4月時的三倍。除此以外,奧特曼還在探索增加晶片供應的選項,以緩解人工智慧行業普遍潛在的挑戰和瓶頸。
![alt](https://static.ctwant.com/images/cover/24/304824/sm-efdeb8685361ca24f6befba3dece501c.jpg)
特斯拉15日成交343億美元奪冠 博通漲超2%再創歷史新高
周五(15日)美股成交額第一名特斯拉收高0.98%,成交343億美元。負責特斯拉車輛在歐洲安全審查的荷蘭車輛管理機構(RDW)周五表示,目前沒有計劃在歐洲召回特斯拉汽車。特斯拉本周在美國召回超過203萬輛汽車,因其自動駕駛系統容易帶給駕駛錯誤的安全感,而且沒有足夠的機制避免被誤用。荷蘭車輛管理局列舉了歐洲和美國市場上自動駕駛控制系統的具體功能差異,並表示正在與特斯拉聯繫。券商古根漢(Guggenheim)將特斯拉目標價從125美元上調至132美元。成交額第二名的微軟收高1.31%,成交291億美元。微軟表示,GPT-4與特殊的提示策略相結合,在語言理解基準MMLU(大規模多任務語言理解數據集)中的表現優於谷歌Gemini Ultra;微軟是GPT-4的獨家授權使用者之一。第三名蘋果則收跌0.27%,成交254億美元。據媒體報導,蘋果目前對於iPad產品線的開發重心,主要放在過渡到OLED方面,後續才考慮可摺疊產品。報導報道稱,蘋果計劃在2024年初對iPad產品線進行重大更新,新款的iPad Air和iPad Pro兩款產品都將有顯著變化。第四名輝達收高1.12%,成交235億美元。本周四(14日)英特爾發佈最新AI處理器,挑戰輝達的同類產品,AI產品市場走向「三足鼎立」;第五名優步(Uber)收跌1.02%,成交226億美元;第六名亞馬遜收高1.73%,成交165億美元。第7名博通(Broadcom)收高2.1%,再創歷史新高,成交134億美元。該股本周累計上漲19.6%。花旗重申對該股的「買進」評級,並將其目標價上調至1100美元,指其有望因AI熱潮受惠。預測該公司2024會計年度的AI基礎建設相關營收,將從2023年度的40億美元大增至超過80億美元。花旗稱,併購雲端運算和硬體虛擬化軟體服務商威睿(VMware),有望令博通2025會計年度的每股盈餘增加超過30%。花旗預測,博通最終有機會達成毛利率78%、營益率58%、每股盈餘60美元的目標。