社交網絡是項新鮮事物,在國際國內迅速發展,其社會、經濟、文化和科技意義十分重大,但理論研究還跟不上實際應用。社交網絡成員影響力 -W 熵指數課題就是在此大氣候下,以促進社交網絡健康發展為宗旨,應運而生 。
W 熵指數是單一的綜合指標表征成員對諸社交網絡的影響力,排行榜的研究和發布本著:獨立、公正、科學、及時的基本原則。目前, W 熵指數門戶網站暫時發表中國社交網絡成員影響力 -W 熵指數兩百人排行榜和政府、企業、財經等領域的 TOP 5 排行榜。 W 熵指數門戶網站後端操作係統的虛擬 “ 機器蜘蛛 ” 自動在網絡上獲取信息,考慮到數據的社會實用性和專家意見反饋等因素,排行榜更新頻率初定為 15 天,測試期間暫不定期。
社交網絡 W 熵指數門戶網站測試版(http://www.transtech.unb.br/w-entropy/)於 2011 年 6 月 8 日上線,首次推出兩百人排行榜, 見圖一。原數據來自國內各大主要社交網絡三千餘人,如新浪、騰訊和穀歌搜索、百度百科等。最後按 W 熵指數排序推出前兩百人 (6 月 10 日數據 ) 。
圖一 社交網絡影響力W熵指數門戶網站截圖
網頁表中各欄的指標定義如下,微博是指某成員在新浪微博的粉絲數或在滕訊微博的聽眾數,如果某成員在兩個平台都有微博,表中列出占主導地位的平台標誌 ( 下同 ) 。博客是指某成員在新浪或的博客訪問量或滕訊博客的曆史瀏覽量。網絡搜索是指某成員在穀歌搜索的文檔數或在百度百科上的訪問量。平均指標是指綜合某成員上述三項指標的加權平均數。分布係數是指某成員在上述社交網絡平台的信息傳播分布係數。最後一欄是 W 熵指數相對值 ( 簡稱 W 熵指數 ) ,以本次排行第一名的 W 熵指數絕對值為基數,依次算出。
1. W 熵指數門戶網站介紹
社交網絡 W 熵指數門戶網站 (www.transtech.unb.br:8080/w-entropy/) 是以信息理論為基礎 、 數學模型和計算方法完整獨立的 、 由網絡技術支撐的信息係統。總體設計有四大主要部分組成:
1) 信息獲取。使用 Web 搜索技術 [10] ,建立社交網絡成員數據獲取模塊,係統設計虛擬 “ 機器蜘蛛 ” 自動在網絡上獲取數據。
2) 數據處理。使用 Web 數據挖掘等人工智能技術 [11] ,建立社交網絡成員數據處理模塊,自動對數據進行過濾、去重、 索引 等知識挖掘業務。
3) W 熵計算。使用社交網絡成員影響力 -W 熵指數的理論和算法 [1-5] ,建立社交網絡成員 W 熵指數計算模塊,自動實現各成員的 W 熵指數和排序。
4) 前端顯示。使用 Web 相關的數據庫、網頁技術等,建立 W 熵指數門戶網站前端顯示係統,進一步將實現人機互動界麵。
社交網絡 W 熵指數門戶網站信息係統尚處於測試階段。係統構成和功能將在以後各方同仁和用戶的建議下,不斷更新完善 。
2. W熵指數千人排行榜的源數據分析W 熵指數千人排行榜的數據來源於國內主要社交網絡諸如新浪 ( 微博、博客 ) 、騰訊 ( 微博、博客 ) 等。搜索方麵的數據直接來自穀歌搜索或百度百科的統計結果。在計算成員平均指標時,微博指數的權重暫時定為 40% ;博客指數的權重為 35% ,網絡搜索指數的權重為 25% 。
社交網絡成員影響力 -W 熵指數排行榜的研究和頒布以促進社交網絡良性發展為宗旨,本著:獨立、公正、科學、及時的基本原則。
1) 獨立。社交網絡成員影響力 -W 熵指數項目研究的問題提出、定義建模、理論分析、實例驗證、係統開發和實時上線均由項目組成員完成,項目投資和設備獨立自主、擁有全部知識產權。
2) 公正。 W 熵指數排行榜的原數據來自網上社交網絡成員的公開資料。對排行榜結果的任何評價,都是客觀的、建設性的,不涉及任何個人隱私、避免使用不適當語言。課題組歡迎任何社交網絡成員和各方行家學者的指導和建議。
3) 科學。社交網絡成員影響力 -W 熵指數的理論計算、數據分析等使用科學方法並有現代信息技術實現,通過學術論文在相關國際信息技術會議上發表,全過程公開透明。課題研究的反饋意見主要來自兩方麵:一是專家對參加本課題的研究人員提交的科技論文的審稿評語;二是在千人計劃網超博等社交網絡本身的網友們的意見。
4) 及時。 W 熵指數門戶網站暫時發表中國社交網絡成員影響力 -W 熵指數千人排行榜和政府、企業、財經、科技、體育以及信息技術 (IT) 等領域的 TOP 5 排行榜。雖然 W 熵指數門戶網站後端操作係統自動在網絡上獲取數據,考慮到數據使用的社會實用性等,排行榜更新頻率暫不定期。
目前,社交網絡 W 熵指數門戶網站收集的數據暫來自新浪 ( 微博、博客 ) 、騰訊 ( 微博、博客 ) 社交網絡平台。搜索方麵的數據來自穀歌搜索或百度百科的統計結果。進一步的研究,將涉及到其它社交網絡平台如中華網、搜狐、網易、人人以及盤古、人民等網絡搜索。