為什麽說:中文互聯網正在加速崩塌?

文章來源: - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
(被閱讀 次)


1

先問你一個小問題:

如果我們在百度上搜索“馬雲”這兩個字,把時間設定在1998年到2005年,能搜出來的信息,大概有多少條呢?是1億條,還是1000萬條,還是100萬條?

我在幾個群問過,大家普遍的猜想是,應該是百萬或者千萬的級別。畢竟,互聯網信息如此浩如煙海。馬雲作為那個時代的風雲企業家,在網上留下的痕跡肯定是非常多的。

但實際上能搜出的全部結果如下:

用百度搜索,選定日期範圍為“1998年5月22日到2005年5月22日”,含有馬雲的信息,總共是1條(2024年5月22日數據)。

而僅有的這一條信息,也是虛假的。點進去會發現,文章的發布時間其實是2021年,不屬於上麵限定的時間段,隻是不知怎麽回事,它被莫名其妙地搜索出來。

也就是說,如果我們想要了解那一段時間關於馬雲的經曆、報道、人們對他的討論、他的講話、公司的發展史等等,我們能得到的有效的原始信息量,是零。

你可能會覺得,這是不是百度的問題啊?如果換必應或穀歌,會不會能搜出來?

我測試過,這兩個網站搜出來的有效信息,和百度沒有太大區別,比百度略多一些,但也隻是個位數。更多的也都是時間紊亂的無效信息,隻不過不知道是什麽技術原因,被錯誤地抓取出來。

你可能還會覺得,是不是因為馬雲屬於比較有爭議的人,由於某種不可描述的原因,所以他的信息才無法搜到?

但實際上,不僅僅是馬雲的情況如此,我們去搜馬化騰、雷軍、任正非等,甚至是羅永浩和芙蓉姐姐這樣在那個時候紅極一時的網紅,或周傑倫、李宇春那樣曾經火遍全網的明星,結果也都一樣的。如搜雷軍的情況,結果是這樣的:

在測試過不同網站、不同人名、不同時間段之後,我發現一個令人震驚的現象:

幾乎所有在那個年代曾經紅火過的中文網站,如網易、搜狐、校園BBS、西祠胡同、凱迪貓眼、天涯論壇、校內網(人人網)、新浪博客、百度貼吧、以及大量的個人網站等,在一定年份之前的信息都已經完全消失不見了,甚至大部分網站是所有年份的信息都消失了。唯一例外的是新浪網,還能找到一些十幾年前的信息,但也是極少數的寥寥幾條,其他99.9999%以上的內容,全都消失了。

大家都沒有意識到一個嚴重的問題:中文互聯網正在迅速崩塌,移動互聯網出現之前的中文互聯網內容,已經幾乎消失殆盡。

我們原以為,互聯網是有記憶的,但沒有想到,這種記憶,原來是像金魚一樣的記憶。

2

我之所以注意到這個問題,是因為何加鹽公眾號的主題是研究牛人,所以我需要經常查找他們的資料。

這兩年來,我有一個非常明顯的感覺:網上能找到的原始資料,每年都以斷崖式的速度在銳減。之前還能看到一些原始的報道,後來慢慢沒有了;之前還能找到主人公的演講或者他們寫的文章,後來慢慢找不到了;之前還能看到很多采訪或對談的視頻,後來慢慢消失了。

似乎有一個吞噬網頁的怪獸,它沿著曆史的時間線,從過去向著現在吞噬,先是小口小口,然後大口大口,把中文互聯網的一切內容,以五年、十年為單位,一口吞掉。

等我們回過神來,會發現,在移動互聯網之前曾經存在過的中文互聯網的一切,不管是門戶網站、機構官方網站、個人網頁,還是校園BBS、公眾論壇,還是新浪博客、百度貼吧,還是文件、照片、音樂、視頻等,都已消失不見。

記得十幾年前,我曾經因為換電腦,把一些照片和文章打成一個壓縮包,存在某BBS上,幾年之後發現,那整個BBS都沒有了。我曾經用過hotmail的郵箱,裏麵有很多很珍貴的郵件,後來全都沒有了。我還寫過人人網、MySpace,後來全都沒有了。

我們曾經以為互聯網可以保留一切,但結果是一切都沒能保留。

這讓我想起劉慈欣《三體》裏麵提到過的“二向箔”。歌者文明發現了太陽係有智慧生物的存在,出於宇宙先進文明的清除本能,他們向太陽係扔出一張二向箔,於是,整個太陽係以光的速度從三維坍塌成二維,變化成一張酷似梵高“星空”的畫片。一切生命、一切文明的痕跡,從此都不複存在。

在互聯網上,我們已經處於二向箔的吞噬之中。這種二向箔可以稱之為“時間的二向箔”,它吞噬的是時間那一維。

太陽係被歌者文明的二向箔拍扁之後,好歹還留下了一幅《星空》圖,而互聯網被時間的二向箔吞噬後,隻留下一片虛空。

3

為什麽會出現這種情況呢?我猜想,主要原因可能是兩個:

一是經濟原因。

網站的存在,需要服務器、需要帶寬、需要機房、需要人員運維,還有很多雜七雜八的監管和維護費用,這些都是成本。如果是有戰略價值(例如需要向外展示公司想要展示的信息),或者有短期流量價值(例如還時不時有較多的人上來看),同時公司賬上也不差錢,那麽還會有動力去維持。

但是如果公司在商業上走了彎路,沒錢了,整個網站就會直接死掉。例如人人網就是典型代表。

即便公司還有錢,從運營的角度來看,如果一個網頁一年到頭都沒有幾個人來點擊,對公司來說,就成了一筆負擔,從經濟上最理性的方法,就是直接關掉。搜狐、網易早年的內容大量丟失,以及以天涯論壇為代表的BBS集體消亡,都是這個原因。

二是監管原因。

總體而言,互聯網信息的監管,是從無到有,從寬到嚴,從嚴到更嚴的過程。以前可以合法存在的內容,後來不符合監管要求了;或者是以前可以灰色存在的內容,後來被定義為黑色了。這些內容都會直接被哢嚓掉。

還有一些是隨著時代的變化,輿論的兩極分化越來越極端,以前“隻道是平常”的內容,在後來的輿論環境中顯得非常尖銳、敏感,盡管不違法,但是可能激化矛盾,形成混亂,監管方也有可能會要求處理掉。

除了官方部門之外,憤怒的網友,也時時充當著輿論監管員的角色。他們會翻出十幾年前某人無意中說的某句話,揪著不放,把人網暴至“社會性死亡”。

但監管上最重要的影響,還不是監管部門的處理或憤怒網友的攻擊,而是它們會造成公司與個人的“自我審查”。

因為誰也不知道,網站上存在的哪一條內容,某人曾說過的哪一句話,會不會在若幹年後,給當事人帶來滅頂之災。最好的辦法,就是直接把這些潛在的“定時炸彈”全部清除,也就是把網站關掉或者把內容全部刪除。

當然,除了上述兩個原因之外,還會有其他很多原因。

例如,在南斯拉夫解體之後不久,所有“yu”(南斯拉夫國名Yugoslavia的縮寫)這個國際域名之下的網頁內容全部消失了。又如,隨著版權保護的加強,曾經隨處可下載的音樂和電影網站,就都消失了。還有一些機構和個人,純粹是由於自己的原因,不想在對外展示信息了,就把官網或個人主頁關掉等等。

但這些原因都是次要的、局部的。整個互聯網內容係統性的、大規模的消失,主要就是由於經濟規律和自我審查。

本質上,互聯網內容和生命一樣,也受進化論的支配。其存在的標準隻有一條:以盡可能低的成本爭取盡可能多的注意力。

當一個內容能夠在互聯網上的海量內容中爭取到足夠多的注意力,而維持這個內容的成本(包括經濟成本、監管成本和對抗監管的成本)比其他方式更低時,這個內容就有可能存活在互聯網上。隻不過它有可能會換一種呈現方式,例如從文字變為圖片,從靜圖變為動圖,從動圖變為視頻,未來可能從二維視頻變為三維全息視頻等等。承載這個內容的平台也會變遷,從門戶網站到BBS,到個人博客,到微博微信,到抖音視頻號,到未來可能一個我們不知道什麽平台。

當一個內容不能再吸引到足夠多的注意力,或者維持這個內容的成本比其他方式更高時,這個內容就會從互聯網上消失。以電腦為瀏覽端、以網頁為載體的傳統互聯網的集體消亡,隻不過是這種“信息進化競爭”的必然結果而已。

生物的進化秘訣是“物競天擇,適者生存”,而互聯網內容的進化秘訣是“信息競,注意力擇,適者生存”。由於網絡效應,這種競爭比自然界還要猛烈萬倍,殘酷萬倍。傳統互聯網不是單個物種式的滅絕,而是幾乎所有內容的整體性滅絕。

每一代新的互聯網崛起,舊的互聯網必將崩塌,時間二向箔是所有網站、所有內容無可逃避的宿命。

4

如果未來的文明是互聯網的文明。我們這一代人,將是沒有曆史的。因為互聯網沒有留下我們的痕跡。

“沒有曆史”,這件事情重要嗎?

當然很重要。

我曾經為了寫邵亦波的文章,想盡了一切辦法,試圖找到邵亦波2007年參加《波士堂》節目的原始視頻,以及他妻子鮑佳欣以“文愛媽咪”網名在寶寶樹社區發了好幾年的帖子。最終還是沒有找到,隻能深深遺憾。

雖然《紅塵已忘邵亦波》那篇文章,依然很受大家歡迎,短短一周就有70多萬人閱讀,2萬多人轉發,但我十分肯定,我一定還是錯過了某些非常重要的信息。如果它們能呈現在那篇文章裏,文章質量會更好。

但是我找不到,就隻能讓文章以不完美的方式呈現。

你可能會覺得:這隻是對何加鹽這樣的研究者和寫作者有用,我又不寫這樣的文章,互聯網信息沒有就沒了,對我又沒什麽影響。

真的嗎?

如果我們已經看不到馬雲的所有演講,看不到任正非的以《我的父親母親》和《一江春水向東流》為代表的所有文章,看不到段永平在雪球的所有發帖,你會不會覺得有點可惜?

好吧,你說你並不覺得可惜。

那如果我們已經搜不到黃崢的公眾號,看不到張一鳴的微博,上不了王興的飯否,你會不會覺得有點遺憾?

好吧,你說你也並不覺得遺憾。

那如果某一天,知乎如同天涯論壇一樣沒了,豆瓣就像人人網一樣消失,B站好比新浪博客一樣已無人問津,你會不會有點心痛?

如果某一天,你喜歡的微博博主所有的微博隻顯示“作者已設置隻展示半年內微博,此微博已不可見”,你常看的公眾號隻顯示“此賬號已被屏蔽,內容無法查看”,你在抖音或小紅書搜索某些信息,結果顯示“作者已清空全部內容”……

甚至,微博、公眾號、抖音、小紅書,就像曾經存在過的bbs、貼吧、空間、博客一樣,全部消亡……

你會不會為此難過哪怕是短短的一分鍾?

作為傳統互聯網的一代人,七零後、八零後已經找不回我們的曆史。因為它們已經全部消失了。

新生代也許還能看看朋友圈,但是朋友圈也越來越多“三天可見”,越來越沉默不語。

唯一還在熱情發圈的,隻剩下一水的營銷信息。

未來就連這些營銷信息,也終將消亡。

5

如果一件事對我們很重要,而它正在消亡,我們有什麽辦法挽救它嗎?

有人曾作出這樣的嚐試。美國有一個網站叫做“Internet Archive”,中文譯作“互聯網檔案館”,保存了很多原始網頁。但是我試過,中文的原始網頁,保存的很少,而且使用非常麻煩,搜索功能十分原始低效,和沒保存差不多。

從技術層麵來講,保存從中國有互聯網以來,到移動互聯網興起的十來年時間的所有網頁,應該並不難,成本也不高,畢竟比起現在的視頻時代,原始互聯網的那些圖文網頁,占的空間幾乎可以忽略不計。

問題是,誰來做這件事,有什麽動機?

商業機構不會做。因為沒有任何商業利益。

政府或許可以像建圖書館、博物館一樣,搞一個能保存所有網頁的檔案館。但是政府為什麽要花錢費力幹這件事?除了保存曆史之外,似乎也沒有其他理由。再說了,就算是政府做了這件事,對普通網民也沒有任何意義,因為這個檔案館肯定也會需要一定的登陸權限,以免信息被濫用。

況且,就算是有機構願意做這件事,現在也晚了。移動互聯網興起之後,傳統互聯網的中文內容,幾乎已經消失殆盡了。粗略估算,99%以上應該都已經沒有了。

從某種意義上,何加鹽寫的牛人係列文章,也為保存這些牛人們存在過的曆史,做出了一點貢獻。如果我沒有寫他們,很多曆史就已經在網上找不到了。但畢竟這也不是原始信息,隻是經我整合過的二手信息。

現在的中文互聯網上,這個世紀前十年發生過的所有重大事件,所有留下過深深痕跡的名人,目前還能找到的信息,幾乎已經全是經自媒體編輯過的二手信息,甚至是傳過多手,早已麵目全非的信息。

關於它們的原始報道沒有了,原始視頻沒有了,原始講話沒有了,原始的網友目擊沒有了,原始的評論沒有了……

再過一些年,這些二手信息和N手信息,也都會消失。就像那些事件從未發生過、那些人從未存在過一樣。

我們已經無能為力,隻能接受現實。

在未來的互聯網時代裏,回首看21世紀的前二十年,將是沒有曆史記錄的二十年。

我們是互聯網時代消失的一代人。

如果你現在還能看到一些中文互聯網的古早信息,那隻是夕陽的最後一抹餘暉。

如果你明白了它們的轉瞬即逝,可能會像臨死前的浮士德一樣感歎:

你真美啊,請停留一下吧。

但那抹餘暉,很快將和你這句感歎一起,被時間的二向箔吞沒,陷入虛空。

《三體》中,程心和艾AA還能有幸乘坐唯一的一艘曲率飛船,逃離正在二維化的太陽係。

而我們,連曲率飛船都沒有。

逃無可逃。

現在你所看到的、你所創造的幾乎所有內容,連同這篇文章,這個平台,終究也會淹沒在虛空中。

一條小路 發表評論於
有了習思想還要什麼互聯網。
zzbb-bzbz 發表評論於
結論正好相反,說明中國的中文互聯網2005年之後爆發式發展
zzbb-bzbz 發表評論於
隻能說海外中文互聯網正在加速崩塌,1998-2005年期間,百度能查到一條關於馬雲,而穀歌一條也沒有
SeSeYiYi 發表評論於
剛才在百度上試了下搜"馬雲",至少幾千條結果. 難道海外的百度和中國的百度不一樣了.
如果隻是1998年到2005年的信息減少,這隻能說明算法就這樣,誰會對十幾年前的互聯網信息感興趣. 去年的互聯網東西我都不一定會花時間去看,早過時了.
一隻熊 發表評論於
我親自動手實驗了,馬雲,雷軍,都沒問題啊結果一大堆。
他說什麽把時間設定成1998-2005,這本身是個奇怪的操作。誰搜索還加時段?中國互聯網那時候並沒有十分普及,內容發布的還不多。你怎麽不說設成1966-1976呢?那搜啥都沒有了。
Simiguy 發表評論於
少有的好文章
iask 發表評論於
這個標題改成“中共國互聯網正在加速崩塌” 更確切些
iask 發表評論於
還能搜到馬雲,算不錯了。

2022年64,李佳琪擺出了坦克蛋糕,石破天驚,給牆內多少中國年輕人啟蒙教育啊、去搜搜 “8964”, “天安門廣場1989”,幾百萬人的抗爭可曾發生過?
bluewave99 發表評論於
網絡備份本身就不一定可靠,特別是免費的。
但很多曆史資料在消失可能是真實的。懂網絡的都知道,你可以靠付費抹去網上的負麵消息。
所以技術手段是存在的。
Maui2021 發表評論於
所以穀歌拒絕留在中國。留下就是為虎作倀。
不懂裝懂 發表評論於
東方明月- 發表評論於 2024-05-23 08:10:53
一直嘲笑美國隻有兩百年曆史。是一個沒有曆史底蘊的國家。
結果發現中國完全沒有曆史,是一個充滿謊言的國家。
---
沒有曆史倒還是不錯。最可惡的是顛倒了是非、混淆了黑白的曆史,而且是小學中學大學的必修課。這也是五毛特別多的原因之一。
InNorthTexas 發表評論於
過兩年,
一日不搜習,
就要鎖機。
gameon 發表評論於
利子當頭,大聰明太多,隱性植入物太多,點進去就是套路,惹不起就躲著走,能不點中文網站就不點。
fancyorange 發表評論於
嗬嗬,這當然是監管的原因。馬雲這樣的人物網上搜尋居然能找不到啥像樣的內容?以前可是鋪天蓋地。那當然是當局打壓的結果了
東方明月- 發表評論於
一直嘲笑美國隻有兩百年曆史。是一個沒有曆史底蘊的國家。
結果發現中國完全沒有曆史,是一個充滿謊言的國家。
showmecn 發表評論於
可以被搜索引擎索引的數據估計不到整個互聯網數據的1%。
百度成立於2000年,商業公司節約成本的話也不會什麽都收錄,或者長期保存,一般會歸檔。
可以用Google,技術更好,收錄更多。 加速崩塌 杞人憂天吧
GuoLuke2 發表評論於
我出國之前發的論文也搜不到了。前幾年還可以。
shakuras2000 發表評論於
我這人的特點就是不信邪,搜了一下穀歌 馬雲在1998和2005年之間,有4,680條。
一篇評論中間摻假也就算了,一開頭那個引題就造假就沒意思了。

google***/search?q=%E9%A9%AC%E4%BA%91&sca_esv=a83470496b33a403&sca_upv=1&sxsrf=ADLYWIKSwqbFMNB9zPd7OBjrCK5S_drNdw%3A1716473025383&source=lnt&tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F1998%2Ccd_max%3A12%2F31%2F2005&tbm=
Timberwolf 發表評論於
去搜搜1998-2005期間的馬斯克黃仁勳看有多少對比一下。
恐怕主要原因是這些人都還沒有出名到被互聯網關注的程度。
lzr 發表評論於
阿裏巴巴1999年創立,18個人的微小企業,你覺得網上會有多少報導?
溫雪承 發表評論於
曆史這東西,留不下就留不下吧,反正我們現在了解的所謂曆史,一多半也都是曆朝曆代禦用史官胡編亂造的。
oldpp 發表評論於
這個很正常,如果那些內容是由中國發布出來的那當然會被整頓。網站的消失,曆史內容的審查等等。這個難道不是每天在中國發生的事兒?凡是對黨國不利的新聞,凡是政府不喜歡的新聞甚至曆史都會被清理掉,不管是1998-2005還是別的年代。
隻看不回貼1208 發表評論於
都差不多,我二十年前論文,都搜不到了。外國好不到哪裏去。
bluetag 發表評論於
互聯網留下太多印記,對某些統治者不利,也增加了企業被審查的風險。
DOC2006 發表評論於
google上我剛剛搜了1998-2005之間的馬雲,確實消息非常少,有效的幾乎沒有。
墨爾本老木匠 發表評論於
造謠。
DOC2006 發表評論於
這篇文章不是說找不到馬雲

而是沒有“1998-2005” 年份的馬雲, 就是互聯網比較早期的消息。

隨著一年一年往前走,那麽2005-2010之間的信息也會逐漸變少,互聯網上的曆史消息會越來越消失不見。

作者的擔心是有道理的,曆史痕跡消失,之後便可以隨便篡改,或者需要的信息消失,永遠找不到。
HZ999888 發表評論於
這網站連這種垃圾文章都上,睜著眼睛說胡話的造謠。都自己百度搜一下試試去。
涼亭 發表評論於
清零帝的愚民政策還是很成功的。
hkzs 發表評論於
我試過了,沒有問題啊。
殺敵三千,自傷一萬 發表評論於
う為了給你留下正確的記憶,老大哥費勁了心機。感恩吧
海之塵HZC 發表評論於
這種題目我可以寫一萬條:

為什麽說:美國互聯網正在加速崩塌
為什麽說:英國互聯網正在加速崩塌
為什麽說:美國正在加速崩塌
為什麽說:作者正在加速崩塌
..........................
luting 發表評論於
我剛試著在BAIDU搜索了馬雲,沒有問題,感覺是不是作者沒付錢家裏網斷了?
寶刀屠龍 發表評論於
小毛er 發表評論於 2024-05-23 02:06:06
搜索不到不代表信息不存在了。我相信各大網站有把舊新聞存檔的。就是說信息還存在,就是不讓公開查詢了。
=====================
這種說法擱不住推敲
商業網站玩的是點擊率,網站能將信息存檔就意味著已投入相應的硬件資源(網站最大資源占項之一)
然後卻通過資源封鎖方式戕害回報率,屬於隻顧投資不求回報(國家圖書館?)
這顯然不合乎邏輯,其實有更合理的解釋
隨著時間推移,投資回報率下降(單位存儲硬件容量獲取點擊率隨著時間推移逐漸衰退)
最後網站將其刪除,留更多空間裝載投資回報率更高的新聞資訊(越新點擊率自然越高)
時不時來看看 發表評論於
隻看到一個原因:作者特別恨中文互聯網,包括文學city
還是老李 發表評論於
確實如此,十幾年前很喜歡一首方言說唱,那時候網上到處都是,可惜沒保存,現在再找,隻能找到一點歌詞,視頻再也找不到了。
小毛er 發表評論於
搜索不到不代表信息不存在了。我相信各大網站有把舊新聞存檔的。就是說信息還存在,就是不讓公開查詢了。
秋林小屋 發表評論於
國內哪有互聯網?隻有個90?%網站都上不去的局域網。
令胡衝 發表評論於



這僅僅是百度的崩潰。信息都在,隻不過百度是個被閹割的信息太監而已。

大號螞蟻 發表評論於
不稀奇。二十四史都是三國演義。東亞文明落後千年。