Google I/O 大會登場 全新AI模型、傳統服務大進化成全場焦點
(圖/翻攝自YouTube)
Google年度開發者大會「Google I/O」於台灣時間15日凌晨1點登場。而今年承襲去年的AI熱潮,將重點放在AI上面,不僅公布了全新的AI模型Gemini 1.5 Pro,同時其餘內容也是圍繞在Gemini與其他服務之間的應用。至於往年的重點「Android系統」,則是放到次日才會介紹,可以說是相當罕見。
在這次的Google I/O大會中,Google官方推出全新的AI模型Gemini 1.5 Flash,同時還升級了現有的AI模型Gemini 1.5 Pro。Google DeepMind的CEO哈薩比斯(Demis Hassabis)解釋,Gemini 1.5 Flash是基於Gemini 1.5 Pro所開發出來的輕量化AI模型,但是功能上並不會差異太大,因為其中使用到「知識蒸餾(Knowledge distillation)」的技術,將Gemini 1.5 Pro的核心知識轉移到Gemini 1.5 Flash中,也因為Gemini 1.5 Flash比較輕巧的關係,執行速度上也會比Gemini 1.5 Pro還要快速。Google官方甚至提到,Gemini 1.5 Flash有足以分析1500頁文件或是超過3萬行程式碼的能力。
而在Gemini 1.5 Pro方面,雖然這是2月份就早已推出的產品,但是在這次開發者大會上,官方宣布Gemini 1.5 Pro也獲得了提升,Google強化了Gemini 1.5 Pro在編寫程式、推理、解析聲音、圖像方面的能力。而官方也將Gemini 1.5 Pro的Token提升至200萬個,這也讓他能夠同時處理的資訊足以大為提升,其中可以同時處理超過2小時的影片、22小時的聲音、超過140萬字的文字或是6萬行的程式碼。
除了公布新開發的模型外,Google也在這次宣布許多傳統既有功能與AI模型結合後的變化,其中包含了搜尋引擎、Google相簿、Gmail、Google雲端硬碟等服務,這些服務都新增了一個「Gemini AI側邊欄」的功能。
「Gemini AI側邊欄」其實就是一個內含AI模型的對話框,用戶可以透過交談的方式,交付AI一些尋找、整理、分析的工作。像是可以在Gmail中,請Gemini AI依據寄件人、日期等條件,幫信箱中的信件進行分類。又或者是請它幫忙撰寫回信、抓出信件重點。
如果是在Google相簿中,甚至可以透過「Gemini AI側邊欄」,要求他幫忙找出符合特定條件的照片,比如「帶有車牌的照片」,甚至是更抽象的回憶問題,你可以向「Gemini AI側邊欄」描述你的回憶,它會想辦法從你的相簿中找尋到相對應的照片。
除了AI模型與傳統功能的結合外,Google官方也公布了多模型AI技術專案「Project Astra」,這項專案主要是讓AI進入到眼鏡、手機當中,之後透過鏡頭來捕捉畫面,即時性的解答用戶的問題,比如協助使用者來分辨眼前的事物,甚至是對眼前的畫面進行生動的描述。