正常,還是不正常 - 科學診斷與防治
文章來源: 幸福生2023-09-23 10:05:25

正常,還是不正常 - 科學診斷與防治
文/幸福生

正常,還是不正常,偶然看到了平等性這篇博文,想從IT專業的角度寫幾句。算是篇小科普,也希望文學城專業團隊能看到。我相信他們的專業性,畢竟是令人羨慕的矽穀公司。

平教是生物醫學的行家,就用個COVID-19的例子吧。

COVID-19是有症狀的,這裏就不多說了,診斷最簡單的方法,就是測溫度。這個相當於,平教的問卷調查。這是從外部的,非專業的,最有效的方法。

如果溫度偏高,文學城的專業團隊,相當於醫務工作者,需要做進一步檢測,相當於做核酸抗原什麽的。下一步還有治療和預防。

關於專業診斷,治療和預防,下麵我提出一點簡單的看法,僅供參考。

首先我先科普一些,“流量作弊”的原理。當然是非常不專業的描述,內行就跳過吧。

文學城的熱點排名,應該用的是點擊量(click),或頁麵瀏覽量(PV - page view),這兩個相差不多。點了就算點擊量,但點了頁麵不一定能加載(load),比如說網速問題 。雖然瀏覽量和點擊量稍有差別,但同樣的缺陷是比較容易造假。

造假的原理並不複雜,常見的是人工點擊,和利用軟件製造出驚人的點擊量。

無論是人工還是用軟件,往往有一個比較明顯的缺陷,就是大量點擊來自相同的IP和相近的時間。

利用這一點,我們可以有了更有效的診斷方法,相當於做核酸。

有權限進背後數據庫的很容易做,something like,
Select count(ip), ip from ClickLogs where blogid=xxx group by ip order by ip desc;

我發現文學城用google analytics, 其實進不了數據庫,google analytics也能看出來。另外提醒一下文學城的技術團隊,你們現在還使用UA,which will stop processing data soon,本來說今年七月一日,延期到明年七月一日。有可能的話盡早升級到GA4。

如果有大量點擊來自相同IP,甚至相近的時間,就可以確診了。當然了,也有可能是一群人,用同一WIFI,同時搶讀精彩的大作,就管不了那麽多了。

確診了,要治嗎?治療就算了吧,什麽大不了的事呀。鑽空子者雖有不齒之嫌,主要還需留空子者亡羊補牢。用醫學的術語叫預防,或叫疫苗。

預防的方法就是把熱點排名,從點擊量改成獨立訪客量(UV - Unique visitors)或獨立IP量(IP - Unique IPs),因為文學城統計匿名訪問,所以隻好用IP,這樣作弊就困難多了。

我寫這篇小文,不是以博主身份寫,我其實算不上什麽博主。雖然博客裏東西也不少,幾乎沒人看。我隻把博客當作一個存儲空間,存放自己辛辛苦苦碼的字。或者說點擊量我以前沒怎麽關心過。

現在發現有人關心,而且是很關心,文學城就有責任做好一點。給出一個公平透明開放的姿態,讓大家開心一下。

正常,還是不正常,相信科學。平教的問卷調查,還有文學城的內部調查,和科學的防治,相信會讓文學城成為一個更公平的平台。