2021 (77)
2022 (73)
2023 (94)
正常,還是不正常 - 科學診斷與防治
文/幸福生
正常,還是不正常,偶然看到了平等性這篇博文,想從IT專業的角度寫幾句。算是篇小科普,也希望文學城專業團隊能看到。我相信他們的專業性,畢竟是令人羨慕的矽穀公司。
平教是生物醫學的行家,就用個COVID-19的例子吧。
COVID-19是有症狀的,這裏就不多說了,診斷最簡單的方法,就是測溫度。這個相當於,平教的問卷調查。這是從外部的,非專業的,最有效的方法。
如果溫度偏高,文學城的專業團隊,相當於醫務工作者,需要做進一步檢測,相當於做核酸抗原什麽的。下一步還有治療和預防。
關於專業診斷,治療和預防,下麵我提出一點簡單的看法,僅供參考。
首先我先科普一些,“流量作弊”的原理。當然是非常不專業的描述,內行就跳過吧。
文學城的熱點排名,應該用的是點擊量(click),或頁麵瀏覽量(PV - page view),這兩個相差不多。點了就算點擊量,但點了頁麵不一定能加載(load),比如說網速問題 。雖然瀏覽量和點擊量稍有差別,但同樣的缺陷是比較容易造假。
造假的原理並不複雜,常見的是人工點擊,和利用軟件製造出驚人的點擊量。
無論是人工還是用軟件,往往有一個比較明顯的缺陷,就是大量點擊來自相同的IP和相近的時間。
利用這一點,我們可以有了更有效的診斷方法,相當於做核酸。
有權限進背後數據庫的很容易做,something like,
Select count(ip), ip from ClickLogs where blogid=xxx group by ip order by ip desc;
我發現文學城用google analytics, 其實進不了數據庫,google analytics也能看出來。另外提醒一下文學城的技術團隊,你們現在還使用UA,which will stop processing data soon,本來說今年七月一日,延期到明年七月一日。有可能的話盡早升級到GA4。
如果有大量點擊來自相同IP,甚至相近的時間,就可以確診了。當然了,也有可能是一群人,用同一WIFI,同時搶讀精彩的大作,就管不了那麽多了。
確診了,要治嗎?治療就算了吧,什麽大不了的事呀。鑽空子者雖有不齒之嫌,主要還需留空子者亡羊補牢。用醫學的術語叫預防,或叫疫苗。
預防的方法就是把熱點排名,從點擊量改成獨立訪客量(UV - Unique visitors)或獨立IP量(IP - Unique IPs),因為文學城統計匿名訪問,所以隻好用IP,這樣作弊就困難多了。
我寫這篇小文,不是以博主身份寫,我其實算不上什麽博主。雖然博客裏東西也不少,幾乎沒人看。我隻把博客當作一個存儲空間,存放自己辛辛苦苦碼的字。或者說點擊量我以前沒怎麽關心過。
現在發現有人關心,而且是很關心,文學城就有責任做好一點。給出一個公平透明開放的姿態,讓大家開心一下。
正常,還是不正常,相信科學。平教的問卷調查,還有文學城的內部調查,和科學的防治,相信會讓文學城成為一個更公平的平台。
另外一個可能是“中國水軍大量湧入文學城”。 請看一位博主幾年前的發帖:
https://blog.wenxuecity.com/myblog/13923/201905/30886.html
同感。對於點擊,我雖然從以前的關心到現在的不在意,但是有兩位朋友分享過得到decent 點擊量的辦法,我發現屢試不爽。
也同意您說的,網站的技術部門應該做點什麽來address public concerns。
佩服你提出的方法。同樣期待文學城的改進。
這裏藏了很多含金量高的文章啊。我會一一拜讀。
另一方麵,就像加把鎖,碰到撬鎖高手也不管用。換個防盜能力強一點的鎖,也不一定管用,總該試試。