OpenAI 推出創新多模態人工智能，整合語音對話與物體識別功能

舊金山 — OpenAI 宣布將於 5 月 13 日推出一款創新的多模態人工智能模型，該模型結合了語音對話和物體識別技術，將人工智能應用帶入新的層面。此次發布會將通過網絡直播的形式舉行，時間設定在太平洋時間早上 10 點。

這一多模態人工智能模型被設計來更精確地處理圖像和音頻信息，能夠協助客服人員更好地理解來電者的語氣和情緒，甚至識別語氣中的隱含意義如諷刺。此外，該模型也能用於教育領域，如輔助學生學習數學知識，或對現實世界中的標誌進行文字翻譯。

根據 OpenAI 的說法，雖然新型 AI 在某些問題解答方面表現出色，超越了目前的 GPT-4 Turbo，但仍然存在給出錯誤答案的可能。此外，公司首席執行官 Sam Altman 也已經否定了近期將發布名為 GPT-5 的新型語言模型或人工智能搜尋引擎的謠言。

OpenAI 的這一新技術展示在即將舉行的 Google I/O 開發者大會前夕尤為引人注目，該技術可能對業界造成重要影響。這一創新的 AI 功能顯示出 OpenAI 在推動人工智能技術進展方面的持續努力。

相關文章