週四,Google向所有 Android 用戶免費提供基於語音的人工智慧聊天機器人功能 Gemini Live。該功能允許用戶透過 Android 裝置上的語音命令與 Gemini 進行互動。值得注意的是,競爭對手 OpenAI 的 ChatGPT 進階語音模式功能(類似於 Gemini Live)尚未完全出貨。
谷歌在上個月的 Pixel 9 發表會上推出了 Gemini Live。最初,該功能是 Gemini Advanced 訂閱者獨有的,但現在任何使用 Gemini 應用程式或其 Android 覆蓋版的人都可以使用該功能。
Gemini Live 使用戶能夠大聲提問,甚至打斷人工智慧的回答。使用者可以從多個語音選項中選擇 Gemini 的回應,從而為互動添加一定程度的自訂。
Gemini 在其官方說明文件中建議了以下語音模式的使用方式:
來回說: 無需打字即可與雙子座交談,雙子座會口頭回應。
大聲集思廣益: 尋求禮物創意、策劃活動或製定商業計劃。
探索: 發現有關您感興趣的主題的更多詳細資訊。
大聲練習: 以更自然和對話的方式排練重要時刻。
有趣的是,雖然 OpenAI 最初在 5 月透過 GPT-4o 的發布演示了其高級語音模式,但從 7 月底開始,該功能僅向有限數量的用戶提供。一些人工智慧專家推測,由於缺乏可用的電腦能力,更廣泛的推廣受到阻礙,因為語音功能可能是計算密集型的。
根據報導,要存取 Gemini Live,使用者可以點擊應用程式或覆蓋層右下角的新波形圖示。此操作會啟動麥克風,允許使用者口頭提出問題。這個介麵包括「保留」Gemini 的答案或「結束」對話的選項,使用戶可以控制互動流程。
目前,Gemini Live 僅支援英語,但Google已宣布計劃在未來擴大語言支援。該公司還打算將該功能引入 iOS 設備,但尚未提供此擴展的具體時間表。