語音產品
」「這家」打敗輝達! 今年最佳AI股SOUN狂飆575%
AI 晶片巨頭輝達 (Nvidia)近年來備受關注,SoundHound AI(SOUN)公司雖然沒有獲得鎂光燈的焦點,但在市場對其 AI 語音識別軟體的需求帶動下,SoundHound 股價在 2024 年大幅飆漲,遠超過輝達。根據《MarketWatch》報導, SoundHound 今年股價已飆升 575%,超越輝達 187.8% 的漲幅。SoundHound上個月公布的第3季營收創下紀錄新高,同時調高全年營收預測。執行長莫哈哲表示:「我們相信語音將成為生成式AI應用的『殺手級軟體』。」Wedbush分析師Dan Ives上個月在一份報告中指出:「該公司持續在汽車、餐飲、金融服務、醫療保健及保險等各產業,看到對其 AI 語音產品的需求,並致力於提升解決方案的產業多元化。」Wedbush 已將 SoundHound 目標股價從 9 美元上調至 10 美元。在第三季財報電話會議中,SoundHound 也更新了其 Polaris 大型語言模型的進展。Mohajer 表示,Polaris 將公司專有的自動語音識別技術提升至「新高度」。Polaris 基於該公司多年積累的數十億次真實對話及以數十種語言進行的超過 100 萬小時的音檔進行學習。然而輝達不僅是 SoundHound 的股東,也是其合作夥伴。今年上旬,SoundHound 宣布了一款車內語音助理,其採用一款大型語言模型,並在輝達的 DRIVE 技術上運作。Ives補充表示:「該公司持續利用與輝達的合作關係,將語音生成式 AI 帶到無需雲端連接的設備端,並將在 2025 年 CES 展示相關技術。」Wedbush 對 SoundHound 的評級為跑贏大盤。
推「複製人聲」AI工具卻不開放使用 OpenAI:因為今年要選舉
推出生成式聊天機器人ChatGPT的OpneAI,日前宣布公司已經開發出一套可以模仿人聲的AI工具,但目前尚未正式對外開放。近期OpenAI也解釋,因為今年要選舉,再加上軟體有安全上的疑慮,所以認為在排除疑慮之前,不應該直接對外開放使用。據了解,OpenAI在官方網站上宣布,他們自2022年底就著手進行開發AI語音引擎,可以透過該項引擎將文字轉語音,或是讓ChatGPT直接使用語音的方式進行溝通(其實目前ChatGPT的手機版已經有語音溝通的功能)。實際透過OpenAI所演示的內容來看,官方宣稱只需要一段15秒的語音片段,就可以透過AI語音引擎聲成相對應的片段,而且可以透過AI翻譯文字的功能,讓語音以各種不同語言的方式呈現。比如採集的目標可能原本母語是西班牙文,但是透過聲音模型的採集,再透過AI的文版輸入,就可以收到採集目標的聲音說著日文或是中文的片段。如此方便又可以想像到的工具,OpenAI並沒有像先前那樣直接提供給大眾使用,而是僅讓少部分的合作夥伴進行測試。為此,OpenAI發出聲明解釋「生成模仿人類聲音的AI語音引擎,存在著嚴重的安全性風險,尤其今年又要選舉」。報導中也提到,目前市面上已經有多家新創公司在著手研究AI複製人聲的技術,甚至有些已經對外開放使用,除了可以運用在娛樂工作室等特定的產品外,在新罕布夏州,已經有出現使用美國總統拜登的聲音來進行市調的自動語音電話。其實除了這套AI語音軟體尚未正式對外公布外,先前OpenAI所推出的影像生成AI工具Sora其實也是抱持著相同的態度,並沒有第一時間公布給民眾使用。報導中也分析,目前OpenAI已經於19日遞交了AI語音引擎的商標申請,推估其目標是要透過這套系統進入語音辨識、數位語音助理的業務,以此來與Alexa等品牌的語音產品競爭市場。
經部公告 影像或語音商品不得含統戰內容
過去有綠委指控大陸進口玩具內含統戰內容,為因應新興影音商品潮流,經濟部正式公告《台與陸地區貿易許可辦法》修正,新增進口物品中明顯有對台統戰的影像或語音者,進口人應負責塗銷後始得上市,否則將被取消進口資格2個月到1年。這些含有統戰的標誌、文字、影像或語音,如是經由經濟部等主關機關於網站公開,相同或近似物品都不得輸入。至於統戰內容樣態如何認定,經濟部表示,後續會跟相關部會討論,再以公告,作為指引。而非屬網站公告樣態,或是海關無法查到,有顯著統戰內容者,新法規明示進口商負有塗銷之責。原本物品外觀有對台統戰的標誌、文字或圖樣,本來就不可以進口。但是過去民進黨立委趙天麟指控,台灣一年至少進口40萬個大陸製有聲玩具,裡面卻暗藏統戰內容,像是「欣欣兔」兒童故事機裡面出現「台灣島是中國最大的1個島」、「11是中國的國慶」等說法,批評法令僅管外觀,對於內容沒有管理。為此經濟部進行修法,將「影像或語音」等內容也納入管制,要求不得出現對台統戰內容,進口人有負責塗銷相關內容之責。如違法將其上市,將被處禁止進口2個月到1年。