人工智慧引發了一場網路爬行之戰

大多數人認為生成式人工智慧會變得越來越好;但事實並非如此。畢竟,到目前為止這就是趨勢。它可能會這樣做。但有些人沒有意識到,生成式人工智慧模型的好壞取決於它們所訓練的大量資料集,而這些資料集並不是由 OpenAI 和 Anthropic 等領先人工智慧公司擁有的專有資料所建構的。相反,它們由我們所有人創建的公共數據組成——任何曾經寫過部落格文章、發布過影片、在 Reddit 貼文上發表評論或在網路上做過任何其他事情的人。 人工智慧研究人員志工團體資料來源倡議 (Data Provenance Initiative) 的新報告揭示了所有這些數據正在發生的情況。這份題為《危機中的同意:人工智慧資料共享的快速衰落》的報告指出,許多感到受到生成式人工智慧威脅的組織正在採取措施隔離他們的資料。 IEEE 頻譜 與資料來源計畫的首席研究員 Shayne Longpre 討論了該報告及其對人工智慧公司的影響。 謝恩朗普雷談: 網站如何阻止網路爬蟲,以及為什麼…

Recent Comments

No comments to show.

Categories