最強大的開源人工智慧模型可以增強人工智慧代理

最強大的開源人工智慧模型具有視覺能力,但可能會看到更多的開發人員、研究人員和新創公司開發人工智慧代理,這些代理可以在你的電腦上為你執行有用的雜務。 艾倫人工智慧研究所 (Ai2) 今天發布了多模式開放語言模型 (Molmo),它可以解釋圖像並透過聊天介面進行交談。這意味著它可以理解電腦螢幕,可能幫助人工智慧代理執行瀏覽網頁、瀏覽文件目錄和起草文件等任務。 「透過這個版本,更多的人可以部署多模式模型,」Ai2 的執行長、華盛頓大學電腦科學家、總部位於華盛頓州西雅圖的研究組織 Ai2 的執行長 Ali Farhadi 說。 “它應該成為下一代應用程式的推動者。” 所謂的人工智慧代理被廣泛吹捧為人工智慧領域的下一個重大事件,OpenAI、Google和其他公司都在競相開發它們。代理最近已成為一個流行詞,但人工智慧的宏偉願景是超越聊天,在收到命令時在電腦上可靠地執行複雜而複雜的操作。這種能力尚未以任何規模實現。 一些強大的人工智慧模型已經具備視覺能力,包括 OpenAI 的 GPT-4、Anthropic 的 Claude…

YouTube Shorts 中將出現大量生成式 AI 視頻

Google DeepMind 產品管理副總裁 Eli Collins 早在 2022 年就首次向公司董事會演示了生成式 AI 視訊工具。 ,看到隨機提示產生的新鮮視訊剪輯是一個大開眼界的時刻。 現在,僅僅幾年後,Google就宣布了在YouTube 應用程式中開發一款工具的計劃,該工具將允許任何人使用該公司的Veo 模型生成人工智慧影片剪輯,並直接將其作為YouTube Shorts 的一部分發布。 YouTube 產品管理高級總監 Sarah Ali…

人工智慧教母希望每個人都成為世界建構者

根據市場導向的科技專家和專業懷疑論者的說法,人工智慧泡沫已經破滅,冬天又回來了。李飛飛不買帳。事實上,被稱為「人工智慧教母」的李彥宏卻押注相反。她正在史丹佛大學兼職休假,與人共同創立了一家名為 World Labs 的公司。雖然目前的生成式人工智慧是基於語言的,但她看到了一個前沿領域,即係統利用物理、邏輯和物理現實的豐富細節來建構完整的世界。這是一個雄心勃勃的目標,儘管沉悶的大佬們說人工智慧的進展已經陷入了嚴峻的停滯狀態,但世界實驗室仍在融資的快車道上。這家新創公司可能還需要一年的時間才能推出產品,而且根本不清楚它何時推出以及是否真的推出會發揮多大作用,但投資者已投入2.3 億美元,據報道,這家新興新創公司的估值為10 億美元。 大約十年前,李透過創建 ImageNet 幫助人工智慧扭轉了局面,ImageNet 是一個客製化的數位影像資料庫,使神經網路變得更加聰明。她認為,如果人工智慧要創造現實世界,無論是現實的模擬還是完全想像的宇宙,今天的深度學習模型也需要類似的推動。未來的喬治·R·R·馬丁斯可能會將他們的夢想世界寫成提示,而不是散文,然後你可以渲染並在其中漫步。攝影機後面,」李說。 「將這種願景轉化為推理、生成和最終的互動需要理解物理結構、物理世界的物理動力學。這項技術被稱為空間智能。世界實驗室自稱是一家空間情報公司,它的命運將有助於決定這個詞是否會成為一場革命或一個妙語。 多年來,李一直著迷於空間智能。當每個人都為 ChatGPT 瘋狂時,她和她以前的學生 Justin Johnson 正在電話中興奮地談論人工智慧的下一個迭代。現任密西根大學助理教授的約翰遜表示:「未來十年將產生新的內容,將電腦視覺、深度學習和人工智慧帶出互聯網世界,並將它們嵌入到空間和時間中。」 。 在與虛擬網路先驅馬丁卡薩多 (Martin…

這項新技術讓人工智慧與它的情感以及你的情感連結起來

總部位於紐約的新創公司 Hume AI 今天推出了一款新的“移情語音介面”,可以將一系列情感表達的聲音以及情感協調的耳朵添加到來自 Anthropic、Google、Meta、Mistral 的大型語言模型中,以及OpenAI——預示著一個人工智慧助理可能會更頻繁地對我們大肆滔滔不絕的時代。 Hume AI 聯合創始人 Alan Cowen 表示:「我們專注於打造具有同理心的人格,以人們會說話的方式說話,而不是對人工智慧助理的刻板印象。」Google和Facebook的情感技術。 《連線》測試了 Hume 的最新語音技術 EVI 2,發現其輸出與 OpenAI 為 ChatGPT…

Recent Comments

No comments to show.

Categories