個人資料
正文

十日談之 出行記 (3)

(2012-06-02 19:48:32) 下一個

 
去開SAS組織的2011分析大會,在旅店裏呆了三天。奧蘭朵二十五度的藍天白雲,隻在會議的間隙匆匆一覽。主題不錯,夥食很好,旅店的服務也比去年在SAS總部的時候好了很多。其間糾集了二十多位中國同行,到當地有名的明府和翠苑樓晚餐,天南海北一通神吹,好不快活。唯一的遺憾估計就是近在咫尺的迪斯尼和海洋公園卻因為時間的緊張無緣再訪了。

SAS這次把往年的商業預測大會和數據挖掘大會合並一起,規模比往年都大。有29個國家的1000多人參加。這次比較新一點兒的主題是文本挖掘和社交網絡在預測模型中的應用。一個典型的例子是,比如每家大的通訊公司為了競爭都建立了相當規模的商業分析預測隊伍,收集購買用戶的人口信息,電話記錄,社區經濟情況,文化背景,職業收入等等,然後建立統計模型,預測用戶需求,幹預可能跳槽的,促銷可能加入的,定位潛在釘子戶。這種模型已經折騰了十多年了,潛力已經消耗殆盡。你天天收到的那些垃圾郵件大部分都是精心設計的預測模型的功勞,但直郵廣告的回複率已經隻有0.5%, 而且日益下降。

怎麽辦?於是社交網絡成了新的數據源。你大姨的小侄子買了個愛瘋,愛不釋手,於是你們家人的朋友的親戚可能就會受影響也跟著愛瘋。你鄰居昨天受了羅砸死的氣,跳槽到衛星了,你聽著也心動,過兩天就有可能砍線買鍋了。以前的模型都是建立在消費者是獨立行動的假說上,現在我如果能把你們這些曲裏拐彎兒的關係弄清了,融入模型裏,就能折騰到市場先機了。歐洲來的一個大師,就講了這麽個探索的故事,用最大電話網絡裏你給他人通話的時間次數可能的內容分類,把你的社交網絡數據化,然後提高預測水準,多掙了點歐元。雖然最近歐元風雨飄搖,但多點兒也是多點兒啊。

另一個正在發展的東西就是文本挖掘。詞兒整得很光鮮,但實質就是從你們的日誌啊記錄啊跟帖啊樓主啊什麽的尋找關鍵詞兒,然後把它條理化,結構化,數據化。比如挖掘一下文學城我愛我家,就能找到最近這幫大姐喜歡什麽樣的沙發,什麽樣的窗簾,什麽樣的馬桶,如此等等。再挖掘論壇,發現一堆馬甲的用詞特點,標點樣式,關心主題,打架規律,就不難科學地猜馬甲。 

新東西就學了這麽一點兒,但活學活用已經不錯了。這回主要的收獲是認識了一幫挖數專家,都是中國人,明珠遺落在他鄉,每個人都有一串故事,晚餐那點兒時間簡直不夠用。仔細一問,還真沒幾個數理出生的,有的搞過英國文學,有的做過市長秘書,有的當過教育部官員,有的竟然是我縣城的老鄉。還有一個坐邊上的,一口京腔,我一報名是哪裏的,大姐就說,那誰誰你知道吧,丫結婚了沒有啊,四十郎當了吧?那誰誰居然就是我原來單位一個特要好的哥們兒。這世界之小,簡直神了。
 

米國人看加拿大,就好像城裏人看鄉下的親戚,一邊讚揚你那裏風景獨好,一邊就好像那什麽邊遠山區啊,同情還是必須的。這回我還真問了一下行業的薪水和加班加點兒的情況,我不得不說,咱們鄉下現在可好啦。冷是冷點兒,但殺菌啊。

在一個酒店喝酒,十五號人大談特談非誠勿擾,討論每一個男角兒女角兒的是非功過,讓我深深覺得自己真的Out了。有歪詩為證:
 

金秋時節奧蘭朵,挖數英豪聚江湖。
明府內外追往事,翠園堂前繪藍圖。
故國月明時有淚,他鄉一遇話成籮。
來年共飲那廝處,非誠勿擾再蹉跎。

[ 打印 ]
閱讀 ()評論 (0)
評論
目前還沒有任何評論
登錄後才可評論.