瀟灑的雲

沒有方向,沒有目標。
飄去飄來,瀟瀟灑灑在九霄。
從不算計,從不尋找。
管他明天化作春雨,還是冰雹。
個人資料
幸福生 (熱門博主)
  • 博客訪問:
正文

正常,還是不正常 - 科學診斷與防治

(2023-09-23 10:05:25) 下一個

正常,還是不正常 - 科學診斷與防治
文/幸福生

正常,還是不正常,偶然看到了平等性這篇博文,想從IT專業的角度寫幾句。算是篇小科普,也希望文學城專業團隊能看到。我相信他們的專業性,畢竟是令人羨慕的矽穀公司。

平教是生物醫學的行家,就用個COVID-19的例子吧。

COVID-19是有症狀的,這裏就不多說了,診斷最簡單的方法,就是測溫度。這個相當於,平教的問卷調查。這是從外部的,非專業的,最有效的方法。

如果溫度偏高,文學城的專業團隊,相當於醫務工作者,需要做進一步檢測,相當於做核酸抗原什麽的。下一步還有治療和預防。

關於專業診斷,治療和預防,下麵我提出一點簡單的看法,僅供參考。

首先我先科普一些,“流量作弊”的原理。當然是非常不專業的描述,內行就跳過吧。

文學城的熱點排名,應該用的是點擊量(click),或頁麵瀏覽量(PV - page view),這兩個相差不多。點了就算點擊量,但點了頁麵不一定能加載(load),比如說網速問題 。雖然瀏覽量和點擊量稍有差別,但同樣的缺陷是比較容易造假。

造假的原理並不複雜,常見的是人工點擊,和利用軟件製造出驚人的點擊量。

無論是人工還是用軟件,往往有一個比較明顯的缺陷,就是大量點擊來自相同的IP和相近的時間。

利用這一點,我們可以有了更有效的診斷方法,相當於做核酸。

有權限進背後數據庫的很容易做,something like,
Select count(ip), ip from ClickLogs where blogid=xxx group by ip order by ip desc;

我發現文學城用google analytics, 其實進不了數據庫,google analytics也能看出來。另外提醒一下文學城的技術團隊,你們現在還使用UA,which will stop processing data soon,本來說今年七月一日,延期到明年七月一日。有可能的話盡早升級到GA4。

如果有大量點擊來自相同IP,甚至相近的時間,就可以確診了。當然了,也有可能是一群人,用同一WIFI,同時搶讀精彩的大作,就管不了那麽多了。

確診了,要治嗎?治療就算了吧,什麽大不了的事呀。鑽空子者雖有不齒之嫌,主要還需留空子者亡羊補牢。用醫學的術語叫預防,或叫疫苗。

預防的方法就是把熱點排名,從點擊量改成獨立訪客量(UV - Unique visitors)或獨立IP量(IP - Unique IPs),因為文學城統計匿名訪問,所以隻好用IP,這樣作弊就困難多了。

我寫這篇小文,不是以博主身份寫,我其實算不上什麽博主。雖然博客裏東西也不少,幾乎沒人看。我隻把博客當作一個存儲空間,存放自己辛辛苦苦碼的字。或者說點擊量我以前沒怎麽關心過。

現在發現有人關心,而且是很關心,文學城就有責任做好一點。給出一個公平透明開放的姿態,讓大家開心一下。

正常,還是不正常,相信科學。平教的問卷調查,還有文學城的內部調查,和科學的防治,相信會讓文學城成為一個更公平的平台。

[ 打印 ]
閱讀 ()評論 (11)
評論
幸福生 回複 悄悄話 回複 '金字塔' 的評論 : 剛剛讀了你的鏈接,覺得水有點深,可能是我天真了。文學城應該公開其google analytics 的數據,部分就行。比如,BG的幾篇博文的IP和時間分析。

幸福生 回複 悄悄話 回複 '金字塔' 的評論 : 沒錯。如果是最專業的水軍,文學城真的無能為力。我想到的隻是換把好一點的錯。或許沒那麽專業呢?
幸福生 回複 悄悄話 回複 'PeonyInJuly' 的評論 : 我雖然不關心點擊量,也完全理解別人關心,更希望公平。
幸福生 回複 悄悄話 回複 'PeonyInJuly' 的評論 : 謝謝誇獎, 心裏美滋滋的。大家都希望文學城,成為清淨之地。
金字塔 回複 悄悄話 這個訴說:“無論是人工還是用軟件,往往有一個比較明顯的缺陷,就是大量點擊來自相同的IP和相近的時間。” 是簡單的假點擊方式,更加複雜的方式是編寫一個小程序,在程序中改變VPN的目的地,或者改變Internet Proxy Address。 網上有成千上萬的免費Proxy可以使用,也有商業PVN可以變換數以千記的IP Address, 從而造成所謂世界各地的“讀者”瀏覽某個特定的網頁。這對於一個軟件工程師來說,並非是一件有什麽不得了難度的大事。

另外一個可能是“中國水軍大量湧入文學城”。 請看一位博主幾年前的發帖:

https://blog.wenxuecity.com/myblog/13923/201905/30886.html
PeonyInJuly 回複 悄悄話 “我寫這篇小文,不是以博主身份寫,我其實算不上什麽博主。雖然博客裏東西也不少,幾乎沒人看。我隻把博客當作一個存儲空間,存放自己辛辛苦苦碼的字。或者說點擊量我以前沒怎麽關心過。”
同感。對於點擊,我雖然從以前的關心到現在的不在意,但是有兩位朋友分享過得到decent 點擊量的辦法,我發現屢試不爽。
也同意您說的,網站的技術部門應該做點什麽來address public concerns。
PeonyInJuly 回複 悄悄話 點讚!這是我欣賞的科學的態度。
佩服你提出的方法。同樣期待文學城的改進。
這裏藏了很多含金量高的文章啊。我會一一拜讀。
幸福生 回複 悄悄話 回複 '平等性' 的評論 : 覺得沒有那麽強大。如能提供那麽多IP,而且又要世界各地都有,分散在不同的地方,並和文學城用戶群一致,再加上用AI技術點擊,就沒辦法了。

另一方麵,就像加把鎖,碰到撬鎖高手也不管用。換個防盜能力強一點的鎖,也不一定管用,總該試試。
平等性 回複 悄悄話 幸福兄好文章。我覺得除了你所考慮的之外,還有一種可能,那就是有神秘而強大的機構或是組織,可以提供數以萬記的特殊IP,專門用來捧紅某一個,或是某幾個用戶。我不知道如果真的有這種情況,在製度上該如何防範。
幸福生 回複 悄悄話 回複 '亮亮媽媽' 的評論 : 懷疑很好理解,文學城應該與時俱進,防止有人鑽空子,做更公正的平台。
亮亮媽媽 回複 悄悄話 點讚!多年前文學城的排名還是很公正的,後來全給搞亂套了。特別是長期占據第一是同一位博主就讓人不得不產生懷疑。
登錄後才可評論.