AI生成的文章數量,就已經超過了人類撰寫文章的數量

今後,我們將不得不接受一個現實,就是未來80%以上, 也許更多的內容都是AI生成的。。。

 

調查的原文

https://graphite.io/five-percent/more-articles-are-now-created-by-ai-than-humans

Methodology

CommonCrawl

Common Crawl maintains one of the largest publicly available web archives. It provides billions of URLs and is used by researchers and developers, and is a key data source for training large language models.

Selection of Articles

We need a representative sample of English-language articles on the web. To do so, we randomly select 65k URLs from CommonCrawl, and confirm that each is in English, has an article schema markup, is at least 100 words, has a publish date between January 2020 and May 2025, and is an article or listicle as classified by the Graphite page type classifier.

AI Detection Algorithm

Accurate detection of AI-generated content is required to make claims about the prevalence of AI-generated articles on the web. There is a considerable disagreement about the accuracy of AI detection algorithms, and many argue that detecting AI is impossible, or at best, highly inaccurate. Many companies offer AI detection algorithms, including Originality.ai, GPTZero, Grammarly, and Surfer. 

To compute the percentage of AI-generated content in an article, we use the same algorithm described in our 2024 whitepaper, but classify each chunk using Surfer’s AI detector with a chunk size of 500 words. We classify an article as AI-generated if the algorithm predicts that more than 50% of the content is AI-generated, and human-written otherwise. 

 

所有跟帖: 

本來就信息垃圾多,別再製造垃圾了,真正的智者,沒時間去看AI生成 -他鄉牧歌1- 給 他鄉牧歌1 發送悄悄話 他鄉牧歌1 的博客首頁 (0 bytes) () 10/19/2025 postreply 19:39:10

不久的將來,人類寫的東西,變成了垃圾,還自以為是智者 -未完的歌- 給 未完的歌 發送悄悄話 未完的歌 的博客首頁 (0 bytes) () 10/19/2025 postreply 19:40:12

有價值的不會變成垃圾,無價的立馬就是垃圾 -他鄉牧歌1- 給 他鄉牧歌1 發送悄悄話 他鄉牧歌1 的博客首頁 (0 bytes) () 10/19/2025 postreply 19:41:41

如何定義價值呢?又該如何評估人類的智慧和腦子 vs AI的智慧和腦子, 人性的弱點 vs AI的弱點? -未完的歌- 給 未完的歌 發送悄悄話 未完的歌 的博客首頁 (63 bytes) () 10/19/2025 postreply 19:43:14

樓上兩個極端LOL, 雙方都有垃圾和非垃圾。AI不應該為人造垃圾負責,但AI垃圾都是人造的 :D -有個用戶名- 給 有個用戶名 發送悄悄話 有個用戶名 的博客首頁 (0 bytes) () 10/19/2025 postreply 19:42:26

家坦AI輸出之所以被一些人認為是G,就是因為大家的發言(輸入)是G。。。 - 未完的歌 -未完的歌- 給 未完的歌 發送悄悄話 未完的歌 的博客首頁 (0 bytes) () 10/19/2025 postreply 19:45:25

先聲明:我是對事不是針對未歌哈,日本那個發明LEC藍光的說過 -他鄉牧歌1- 給 他鄉牧歌1 發送悄悄話 他鄉牧歌1 的博客首頁 (185 bytes) () 10/19/2025 postreply 19:46:55

知道,知道的 :D -有個用戶名- 給 有個用戶名 發送悄悄話 有個用戶名 的博客首頁 (0 bytes) () 10/19/2025 postreply 19:48:25

那個人我知道,談不上多偉大,也不是啥智者,最多是個發明家,一個日本匠人而已。千萬不要把他的話當真理 -未完的歌- 給 未完的歌 發送悄悄話 未完的歌 的博客首頁 (0 bytes) () 10/19/2025 postreply 19:49:23

我做過漢字檢索,Al先驅,不可能檢索出數據庫沒有的數據,盡管現在發展了 -他鄉牧歌1- 給 他鄉牧歌1 發送悄悄話 他鄉牧歌1 的博客首頁 (110 bytes) () 10/19/2025 postreply 20:04:18

AI已經學完人類的知識了,下一步就是自我學習,包括人類知識體係創造出新的知識體係,進一步學習, -未完的歌- 給 未完的歌 發送悄悄話 未完的歌 的博客首頁 (0 bytes) () 10/19/2025 postreply 20:14:01

造謠造假的代價更低了。 -katies- 給 katies 發送悄悄話 (0 bytes) () 10/19/2025 postreply 19:42:49

AI沒有情緒,也沒有潛意識。。 -無發有天- 給 無發有天 發送悄悄話 (93 bytes) () 10/19/2025 postreply 19:44:38

會有的。AI之父從另一個角度看這個問題: 我們大多數人對”心智“的理解,是錯誤的。。。 -未完的歌- 給 未完的歌 發送悄悄話 未完的歌 的博客首頁 (81 bytes) () 10/19/2025 postreply 19:46:32

老魏,這個不是意識。 當AI感知到物體在旁邊時,嘴上說,“物體在旁邊“,心裏劃過”我會不會看錯了“ 這個才是意識。。 -無發有天- 給 無發有天 發送悄悄話 (68 bytes) () 10/19/2025 postreply 19:55:15

我知道你在說什麽,自主意識,AI能不能有自我意識是我唯一的疑問,其他都不難,包括你說的情緒 -未完的歌- 給 未完的歌 發送悄悄話 未完的歌 的博客首頁 (0 bytes) () 10/19/2025 postreply 19:58:07

這篇文章也是AI 寫的。。以後引導人使用AI的文章都是AI寫的。。 -zhuangqiushui- 給 zhuangqiushui 發送悄悄話 zhuangqiushui 的博客首頁 (0 bytes) () 10/19/2025 postreply 20:01:55

當然是辛頓最新訪談的內容,1個多小時的訪談,有興趣你可以聽一下 -未完的歌- 給 未完的歌 發送悄悄話 未完的歌 的博客首頁 (214 bytes) () 10/19/2025 postreply 20:12:07

嗬嗬,一個多小時,沒工夫看,估計你也沒看,是不是AI 幫你做了summary?以後ai寫ai 看,沒你什麽事了 -zhuangqiushui- 給 zhuangqiushui 發送悄悄話 zhuangqiushui 的博客首頁 (0 bytes) () 10/20/2025 postreply 00:17:51

Google最新發布AI腫瘤基因變異檢測模型,首個跨測序平台跨癌種的 AI 突變檢測係統。那個智者能做到? -未完的歌- 給 未完的歌 發送悄悄話 未完的歌 的博客首頁 (753 bytes) () 10/19/2025 postreply 19:55:04

請您先登陸,再發跟帖!