隨著「AlphaChip」的興起,Google和Meta更新了他們的人工智慧模型

隨著「AlphaChip」的興起,Google和Meta更新了他們的人工智慧模型


隨著「AlphaChip」的興起,Google和Meta更新了他們的人工智慧模型
放大 / 本周有很多人工智慧新聞,報導這些新聞有時感覺就像跑過一個充滿懸掛的 CRT 的大廳,就像蓋蒂圖片社的插圖一樣。

感謝 OpenAI,本週人工智慧新聞異常繁忙,其中包括首席執行官 Sam Altman 發表的一篇有爭議的博文、高級語音模式的廣泛推出、5GW 數據中心的傳聞、重大員工變動以及戲劇性的重組計劃。

但人工智慧世界的其他領域並沒有步調一致,各行其是,每分鐘都在推出新的人工智慧模型和研究。以下是過去一周其他一些值得注意的人工智慧新聞的摘要。

Google雙子座更新

週二,Google宣布更新其 Gemini 型號陣容,包括發布兩款可量產的新型號,它們是對過去版本的迭代:Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。該公司報告稱整體品質有所提高,在數學、長上下文處理和視覺任務方面取得了顯著進展。 Google 聲稱 MMLU-Pro 基準測試的效能提高了 7%,數學相關任務的效能提高了 20%。但如您所知,如果您閱讀 Ars Technica 一段時間,您會發現人工智慧基準測試通常並不像我們希望的那樣有用。

隨著模型升級,Google 大幅降低了 Gemini 1.5 Pro 的價格,將 128,000 個代幣以下的提示的輸入代幣成本降低了 64%,輸出代幣成本降低了 52%。正如人工智慧研究員 Simon Willison 在他的部落格中指出的那樣,「相比之下,GPT-4o 目前的價格為 5 美元/[million tokens] 輸入和 $15/m 輸出,而 Claude 3.5 Sonnet 的輸入是 $3/m,輸出是 $15/m。 Gemini 1.5 Pro已經是前緣機型中最便宜的了,現在甚至更便宜了。

Google也提高了速率限制,Gemini 1.5 Flash 現在支援每分鐘 2,000 個請求,Gemini 1.5 Pro 每分鐘處理 1,000 個請求。谷歌報告稱,與先前的版本相比,最新型號的輸出速度提高了一倍,延遲降低了三倍。這些變化可能會讓開發人員比以前更輕鬆、更經濟地使用 Gemini 建立應用程式。

Meta 推出 Llama 3.2

週三,Meta 宣布發布 Llama 3.2,這是我們過去廣泛介紹過的開放權重 AI 模型系列的重大更新。新版本包括具有 110 億和 90B 參數大小的視覺大型語言模型 (LLM),以及專為邊緣和行動裝置設計的 1B 和 3B 參數的輕量級純文字模型。 Meta 聲稱,視覺模型在圖像識別和視覺理解任務上與領先的閉源模型具有競爭力,而據報道,較小的模型在各種基於文本的任務上優於類似大小的競爭對手。

Willison 對一些較小的 3.2 模型進行了一些實驗,並報告了模型尺寸的令人印象深刻的結果。 AI 研究員 Ethan Mollick 展示了在他的 iPhone 上使用名為 PocketPal 的應用程式運行 Llama 3.2。

Meta 也推出了第一個官方「Llama Stack」發行版,旨在簡化跨不同環境的開發和部署。與之前的版本一樣,Meta 提供免費下載模型,但有許可證限制。新模型支援多達 128,000 個令牌的長上下文視窗。

谷歌的 AlphaChip AI 加速晶片設計

週四,Google DeepMind 宣布了人工智慧驅動的電子晶片設計 AlphaChip 的一項重大進展。它於 2020 年開始作為一個研究項目,現在是一種用於設計晶片佈局的強化學習方法。據報道,Google在最近三代張量處理單元(TPU)中使用 AlphaChip 創建了“超人晶片佈局”,這些晶片類似於 GPU,旨在加速人工智慧運算。谷歌聲稱 AlphaChip 可以在數小時內產生高品質的晶片佈局,而人工則需要數週或數月的時間。 (據報道,英偉達也一直在使用人工智慧來幫助設計其晶片。)

值得注意的是,Google也在 GitHub 上發布了 AlphaChip 的預訓練檢查點,與公眾分享模型權重。該公司報告稱,AlphaChip 的影響力已經超出了 Google 的範圍,聯發科等晶片設計公司已在其晶片中採用並建構了該技術。據谷歌稱,AlphaChip 引發了晶片設計人工智慧的新研究,有可能優化從電腦架構到製造的晶片設計週期的每個階段。

這並不是發生的全部事情,但這些是一些主要的亮點。由於人工智慧產業目前沒有放緩的跡象,我們將看看下週的情況如何。



Source link

More From Author

英超:布里斯托 41-44 格洛斯特 – 韋德帽子戲法幫助擊敗熊隊

英超:布里斯托 41-44 格洛斯特 – 韋德帽子戲法幫助擊敗熊隊

美國司法部起訴伊朗人涉嫌川普競選活動的「駭客洩密」計劃

美國司法部起訴伊朗人涉嫌川普競選活動的「駭客洩密」計劃

Leave a Reply

Your email address will not be published. Required fields are marked *

Recent Comments

No comments to show.

Categories