folksonomy按照數學模型的理論推斷的確能達到最終的見山是山,見水是水,見山不是山,見水不是水,見山還是山,見水還是水的這麽一種由淺入深,有內到外,有最終形成一種提綱挈領的的判斷.
為什麽突然想起這個呢?今天看到ptree《同分妄見與家族相似》提到從哲學上,探討本體論與分眾論的曆史淵源。很值得一讀。其實期間還有值得挖掘的東西還很多
http://ecolab.ruc.edu.cn/blog/zhangsr.php?itemid=132
3月28日
如果你已經看相關的關於Tags的各種說法,我希望你能夠暫時忘掉全部的那些解釋,之後再重新回憶起來;但如果你還不了解Tags,那麽有必要先閱讀文章最後留下的鏈接,然後回到上一步:)
那麽,什麽是Tags?很簡單,往下看;
·經典的信息構成模式;
在傳統的網頁組成中,我們通常使用Taxonomy(分類法)來歸納、整理和存放我們的信息,圖書館是一個絕好的例子,所有的信息從一個點開始,形成樹狀的分類,由此構成一個完整的、相互聯係起來邏輯體係;
這個體係從一開始就是人為分類形成的,在我們需要檢索的時候,幾乎不需要費多大的勁;
[例子]比如我們的Blog,首先有一個主標題,然後下分若幹分類,實際的文章則分類儲存在這些不同的分類中;在一般情況下,我們不允許一個文章同時存在於多個分類中,以便於我們管理的方便和檢索的唯一性;
在網絡上,dmoz和wiki都算是比較典型和知名的例子;
·散秩的信息構成模式;
看似無序的浩渺信息,其中的絕大部分是通過“語言”來描述的,這表明了這些信息的指向性,因此我們通過提取這些語言(文字、文本)的相同部分,以此獲得相關的信息;這些信息平時是完全鬆散、互不聯係的,當且僅當我們對其加以提取的時候才呈現相對緊湊的組織結構,即便如此,這個結構和經典的分類結構相比,仍然是足夠散秩的。
[例子]你可能已經想到了,Google嘛。目前絕大部分的搜索引擎所依賴的正是這一點,因此對於分詞的研究是這些搜索引擎始終的重點和痛苦,其他的不說,僅僅邏輯實證主義和日常語言學派這兩個當代的流派就足夠他們折騰到下個世紀去了。
舉一個惡搞點的例子:當我說:“他媽”的時候,僅僅檢索關鍵字而並不關心其在日常語言中實際運用的搜索引擎怎麽知道我是在罵人還是在陳訴一個歸屬性事實呢?更何況我們經常麵對google上數萬和關鍵字原本語義要求完全不同的搜索結果長聲歎息。
[簡介]
邏輯實證主義:認為人類的日常語言充滿的謬誤,需要徹底厘平,重構一個像數學一樣完美的邏輯語言體係;
日常語言學派:認為人類的日常語言是非常合理而符合現實的,“完美”的邏輯語言並不存在而且也不符合現實;唯一的問題在於人們使用日常語言的時候出了一些方法上的問題,這需要我們加以重視和研究。
(後者正是我傾向讚同的結論)
·符合未來發展的信息構成模式;
現在我們綜合起來考察以上兩種在我們日常生活中顯得日益重要的信息構成模式,會發現他們各有優點和缺陷;
對於前者而言,語言所表達和內涵的思想是廣博的,構造簡單的分類邏輯無法詮釋和標識某一篇文章所設計的全部重點,複雜的分類則將陷入無限微觀的悖論邏輯;
對於後者而言,除開分詞的煩惱,Google們也許還希望承天下之大義擔負起教導每一個人重修日常語言學分的重任,並且要求每一個人都能達到維特根斯坦的高度。
路德維奇·維特根斯坦?對了,這終於回到我們的重點。
維特根斯坦本人正是邏輯實證主義和日常語言學派先後的奠基人,而在他的後期的日常語言思想中,他提出了一個大家相對比較熟悉的觀點:家族相似。
以下引用一段話作大致的解釋:
維特根施坦從“反本質主義”立場出發反對語詞的定義化。本質主義者認為同一類事物之所以成為該類事物,是由於它們具有共同的本質(共相),定義就是規定事物的這種本質。維特根施坦則認為事物根本沒有共同的本質,隻有“家族相似”。所謂“家族相似”不是共同的相似,而是這一方麵或那一方麵的不完全相似。例如一個家族中的成員之間有的眼睛相似,有的神態相似,有的臉龐相似。因此,維特根施坦堅持一種唯名論的立場,認為人們在日常生活中使用一般性的名詞概念隻是為了方便,本質、共相那種形而上學的東西是不存在的。誤把這些東西當作存在,就會染上“哲學病”。
好吧,看出來了嗎?那些相似的地方就是Tags(標簽);上麵引用中處處提到本質、反本質、家族相似,我們處處可以當作分類、碎片和標簽來閱讀和理解。
2005-3-27 17:15:51 Aether answer vistor:我覺得有必要討論tags應用的兩個重點,
1、適用範圍;
Tags應用必然是針對廣泛、相對散秩同時有更高質量要求的信息群落;(和生命本身一樣,也是整體無序中產生的部分有序)
這個無序的群落要構成足以產生有序的宏觀規模,少則幾千,多則應該上萬,數十萬;但是同時不能無限製膨脹,規模再高,Tags的作用可能就不及完全無序的關鍵字了;
因此僅僅在一個個人Blog的內部,為區區數十上百條信息建構相對散秩的Tags,實際意義不大,因為對於少量信息人為的分類應該已經足夠;而通過統一的標準加以組織、集中和聚合,才有可能形成有效的規模;
2、關鍵效用;
Tags產生以後,在檢索的過程中,和關鍵字檢索幾乎沒有任何區別;因此Tags的關鍵部分在於它產生的過程:廣大的用戶群對錄入的信息人為地加以預篩選。
因此這要求對錄入的過程有比較有效的監督;同Wiki一樣,這種開放式的預篩選過程不同於分類法的完全封閉和控製,這方麵的研究還有待深入和繼續。 (via here)