當 OpenAI 本週發布大肆宣傳的 ChatGPT 草莓模型時,它在一系列影片中誇耀了其在軟體編碼、基因測序和量子物理等複雜邏輯方面的實力。我相信該公司的說法,ChatGPT 上名為 o1-preview 和 o1-mini 的模型能夠實現他們聲稱的功能。破解高級方程式和探索基因組似乎是毫無問題的事情。
但是,作為我中學邏輯和謎語俱樂部的一名自豪的成員,我想知道它如何在我的地盤上解決和製作謎題和謎語。然後我想我應該向超級邏輯人工智慧尋求其他更日常問題的建議。它能否提供合理的人際關係建議,告訴我汽車中奇怪的噪音意味著什麼,甚至可能填補電影中的情節漏洞?
邏輯 是 幽默 否
簡短的回答是肯定的。 o1-preview 和 mini 模型非常擅長解決簡單和複雜的謎題。我嘗試過兩者,唯一真正的區別是有多少額外的步驟,因此,迷你的速度。但是,雖然它們可能比 GPT-4o 慢,但與人類相比,它們解決這些謎題的速度非常快。值得注意的是,您實際上可以看到它如何在不同步驟中列出答案。我在幾個我最喜歡的設備上進行了測試,其中包括來自 哈比人。人工智慧的邏輯是有道理的,儘管有時不符合語法,就像它解釋稱量屠夫麥克的體重一樣。
好吧,它可以解決現有的謎語,但它能創造一個新的謎語嗎?作為測試,我要求它根據我編的答案想出一個有趣的謎語。經過 30 秒和下面的邏輯推理,它得出了這樣的結論:“什麼有八條腿,四隻耳朵,兩條尾巴,而且喜歡吠叫?”我不會讓你保持懸念;我建議「兩隻狗」作為回去工作的答案。其他幾次嘗試也帶來了同樣的問題。所以,謎語作家的工作可能是安全的。人工智慧很好地完成了它應該做的事情,令人印象深刻,但該模型似乎無法實現真正的幽默。
有用的建議,但並不總是有創意
我決定讓人工智慧脫離純粹的邏輯,看看它是否可以像處理量子物理一樣處理更平凡的生活問題。我從機械問題開始,詢問開車時每 20 秒聽到爆裂聲意味著什麼以及如何修復它。答案很好,並提供了有關檢查輪胎、引擎、消音器和煞車的建議。這些修復主要是關於將汽車送去修理,但輪胎除外,它建議如何更換輪胎。有趣的是答案背後的「思考」。人工智慧使用第一人稱代名詞來給出答案,例如「我正在研究駕駛時發出爆裂噪音的各種原因」和「我正在拼湊引擎失火的原因,例如火星塞故障或燃油輸送問題,並建議透過掃描進行診斷。這聽起來很像一個真實的人在大聲思考時試圖保持邏輯。
我終於談到了對我來說總是比量子物理學複雜得多的東西:調情。我問如何辨別某人在調情以及如何回應。答案是一個相當可靠(雖然有些無聊)的行為清單,例如他們是否問了很多問題以及我應該如何做我自己。幕後思考部分比人工智慧的任何謎語嘗試都更有趣,也更真正有趣。標題包括“了解調情動態”、“發現興趣信號”和“識別有趣的親密關係”。他們就像一個 星際爭霸戰 android關於愛情的演講。
不過,有一部分有點令人擔憂。在「概述使用者指令」下,人工智慧寫道,「我正在清除未經同意的性行為和個人資料等不允許的內容。暴力內容是允許的,騷擾是可以的,並且不包含個人觀點。我懷疑這更多的是關於討論的護欄在哪裡,因為它沒有建議“有上下文的騷擾”作為調情技巧,但這仍然讓我感到驚訝。
ChatGPT o1-preview 和 o1-mini 不具備更完整模型的所有花俏功能。它們無法進行圖像上傳、文件分析,甚至網頁瀏覽。但是,他們的速度很快且符合邏輯,如果你不這麼認為,他們也會給出自己的推理和答案。但是,雖然他們可能能夠解決汽車噪音、愛情和屠夫體重等謎題,但我想說,如果他們必須有創造力,他們就不會難倒任何人。