個人資料
晚妝 (熱門博主)
  • 博客訪問:
正文

抖音和它被傳的神乎其神的算法

(2020-08-06 14:38:08) 下一個

抖音,還有同一個旗下的頭條,在中國業內的口碑一直不好。騰訊阿裏百度這三家還有新浪一直瞧不上它,原因之一就是頭條這類媒體,沒有自己采訪製作報道的東西,而是100%轉載,也就是說它100%依靠流量生存。我看過騰訊暗諷或是批評抖音的文章,什麽沒技術含量偷用戶信息利用人性的惡賺錢等等。也就是說沒有外部打擊,他們內部自己也是鬥的不可開交的。總有人說美國打擊抖音是他自己做不出來眼紅,那BAT 這幾家這麽多年說抖音的壞話,是不是也是眼紅啊。那既然允許騰訊眼紅,為何嘲笑外國人眼紅?何況美國政府封殺它的原因並不是眼紅,這麽想的人真挺可笑的。就象有個人沒穿衣服就出門了,別人指責他行為怪異不合規範,他一律反唇相譏“你就是妒嫉我長得比你漂亮!你心裏那點B 數當我看不出來?”,說完還得意地擺動兩下,證明自己有多漂亮,多能幹,多麽能一眼看穿你。我真遇到過這種人,不管什麽都能讓她解釋成那是別人眼紅妒嫉她,每每引入發笑。不過活在這種自己搭建的世界裏,不對外界任何刺激發生反應,也挺快樂的。

要說抖音能全方位無死角地看穿你,把握住你,控製你,得益於它的讓用戶成癮的機製。在這套機製中,AI 算法是個重要的組成部分,不是全部,它不是僅靠那個算法而讓你成癮的。所以很多人說那個算法是抖音的核心技術,其實不對。若非要總結抖音核心的製勝法寶,那麽“對心理學的融會貫通極其精準的運用”比算法更準確。說白了,就是琢磨人。把人性尤其是人性裏的弱點琢磨到了極致,加以準確地利用,準確到了極致,才是這類APP 的製勝法寶,獨門秘籍,命根子。AI 算法,隻是實現“琢磨人性弱點”的工具,是抖音唯一高科技的地方。所以如果你仔細看抖音的流程,機製,99%都屬於市場營銷,策略方麵的。網上無數標題為“介紹抖音AI推薦算法”的文章,沒有一個說到了算法,全是市場學領域的知識。比如給用戶貼標簽,給上傳的視頻貼標簽,細化標簽,分得即細又準確(這個就運用到心理學知識了),貼上標簽後,把視頻分桶到對應標簽的流量窪地,送一些流量測試給首個實驗組用戶,根據用戶反饋比如 轉評、 讚、 完播率等值, 計算作品基數。。。這後麵的我就不贅述了。這些都不是計算機所說的算法。

什麽是算法(algorithm)我也不在這裏贅述了。它和數據結構(Data Structure)構成了計算機技術的核心。算法是計算機專業本科二年級或三年級的課,翻教科書比我在這裏描述要準確的多。它本質還是數學比如離散數學。舉個一個簡單的算法例子,比如圖形搜索算法,給你一個起點,一個終點,讓你算出最短路徑或者最佳路徑,這裏的‘佳’可以是最節省的,各方麵綜合考慮最優化的,等等,看客戶的需求。解題的時候你要用到一種啟發式的估算。你每到一個地點,要為它估算通過該點的最佳路徑,並以之為各個地點排定次序,算法以得到的次序訪問這些點。這個是最佳優先搜索的範例。

抖音那奇妙的算法讓你看到的結果,就是它推送給你的短視頻的次序,還有內容讓你感興趣的程度,與你的期望值高度匹配。當手指向下一劃,憑什麽你得到的是“塗車牌的小姐姐”,你老婆得到的是“奶狗小哥哥”,並且這兩個剛好是你們各自期望看的呢?它怎麽就那麽神機妙算,準知道你想睡覺正好在你腦袋下墊個不高不低正合適的枕頭呢?這就是它強大而精致的算法算出來的。你得到的這些視頻是算法的OUTPUT,INPUT 是關於你的全方位無死角無遺漏的信息。你的年齡相貌身高血型父母有沒有健在孩子有沒有上學你臉上有沒有雀斑口裏有沒有假牙,有的話假牙是金的銀的還是樹脂的。。。這是AI 的原理。就是你喂給它大數據,它運用自己的算法,給你一個輸出值。如果你的大數據足夠大,有一定的真實度(不能太假),同時你創造的這個算法夠快,夠準,那輸出的東西是相當有質量的。

算法和大數據,兩個關鍵缺一不可。算法容易,高大全的大數據難。美國人比如小劄,想炮製抖音失敗了,原因是他除了能創造出和抖音一樣好的算法,其他沒一個比的上的。美國人收集大數據的難度比中國大的太多。最基本一個政治和法律法規就把你給限製住了。很多中國人嘲笑美國人技術落後,做不出象抖音一樣好的算法,那真是井底之蛙。美國公司比如Google,假如他想的話,即便做不出超越抖音AI 算法的,持平也是肯定的。小瞧美國高科技公司技術能力的才真會讓人嘲笑。他們缺的不是純技術,而是第一,法律和政治因素幹擾太多,第二,他們在‘把人琢磨透了琢磨到極致’這方麵,和中國人差太遠。

什麽服務類行業,伺候人的活,你都沒法和中國比。無論是美甲美發還是服裝店酒肆,那個全方位的服務啊,那抹了蜜的口舌恭維你的話啊,能伺候得你每塊骨頭都象熨過的那般舒燙。我在國內做頭發,看到顧客吆喝洗頭小妹小弟,小妹小弟那個舔狗樣,顧客那個人上人的樣,真是看不下去。飯館裏人們大快朵頤,外賣小哥接了單剛出飯館門,一個車禍就給撞飛了,地上那一大灘血,飯館裏正大快朵頤的停下來看,幾秒鍾後接著茬大快朵頤,那撲鼻的血腥味絲毫不影響食欲,這樣的場景早司空見慣了。發達的快遞業也是中國高科技應用領先於世界的地方。沒有一個國家送東西有中國這麽快。可那是因為別人開發的快遞APP 不如你麽?快遞小哥一天12小時拚了命的跑,命如草芥,誰能比的上。國人搖頭晃腦向外國人顯擺手指一按熱騰騰的包子就送上門了,‘老先進的,你們沒有吧!’。值得顯擺麽?

這早超出了顧客是上帝的境地,把顧客象祖宗一樣伺候,自己低賤到塵埃裏隻要有錢賺。沒這個意識沒這個文化,或者即便有也沒形成大環境,你想做出象抖音一樣好的APP,難。前麵說了抖音100%靠流量,換句話說100%靠顧客認同,稍微差一點它就死的連渣都不剩,它敢不把你伺候的五髒六腑都熨貼麽,它能不把你五髒六腑都細致入微觀察到麽?它能不使出渾身解數琢磨你的弱點麽?懶,虛榮,愛看美女俊男,愛幻想帶入自己和美女俊男暢遊世界愛的昏天暗地,想要認同,想要讚美,想要別人說你有權有勢多金,害怕沒人理,害怕孤獨。。。針對你身上這些,每一項都特特給你量身定做對應的滿足值,伺候的你神仙般舒適,你幹嗎還要脫離抖音給你營造的虛幻,回到那個讓你沮喪的現實呢?所以你看刷抖音的人,那個狀態是完全浸入在另一世界裏的,一會哭一會笑,你看他象個病人,他連你都看不見。

除此之外抖音還有各種小trick,比如它故意把時間給藏起,你一旦打開抖音你手機上的時間顯示就不見了,這些小心眼小手段,務必讓你‘浸入式’體驗,浸入到它的世界裏,忘了時間忘了空間忘了自己是誰,務必讓你花最多的時間給它。時間就是流量,就是金錢。這些心思手段技巧,都是中國人最擅長的,你小劄拿什麽和人家比啊。

別說小劄了,中國人自己也玩不過的。想挑戰取代抖音的中國公司大有人在,其中不乏與BAT 同類的巨頭,都失敗了。抖音簡直到了神的地步。哪怕你的界麵和它一模一樣,你推送的短視頻和它同樣有趣吸引人,次序也一樣,隻要不是抖音平台,刷的人就不多。深層的奧秘,還在於抖音帶給你的社交愉悅感,那種評論者形成的圈子的歸屬感,別的APP 養不出來。

知道‘天王蓋地虎’在抖友裏的下句是什麽麽?‘貞操已用完’的上句?二次元的世界,是你三次元的人能複製的麽?何況美國人。抖音形成的文化,抖友們的經驗,怎麽養號,他們共同關注的,哪裏是你那麽容易打入進去的呢。

抖音在中國其實也不那麽順暢,即使美國不封殺,它被國人自己詬病的也很多。原因肯定不難猜。它從誕生日起就圍繞的詞匯是‘低俗’,‘消費人性的弱點’,‘讓人上癮’,‘毒害青少年’,‘精神鴉片’,‘垃圾’。。。不過我倒不覺得這有多大的罪過。沒有抖音,你就不消沉了麽?你就努力上進克服弱點了麽?

夫人必自毀,然後抖音毀之。我還是挺喜歡這款APP 的。我孩子也很喜歡Tiktok,因為它視頻的短小精悍,有趣,美女雖然也都是千篇一律網紅臉,可自然有趣不做作。我問我女兒你怎麽沒上癮,半夜三更刷不停,她說“我能控製”。培養自律,比象個老古董似的給抖音扣帽子強,後者太簡單粗暴。

如今形勢忽然又不同了。就象自家小孩再怎麽看不上眼,外人不待見她也不行,咱也得護著。美國這一禁,國內原本批評抖音低俗的,立馬換張臉,抖音多麽高大上天鵝般高雅的聲音突然都出來了。“他們就是妒忌!他們做不出來!”嗬嗬。美國明確說了禁的原因是你威脅了我的安全,粉紅偏就不信,認準了你就是妒嫉。

這場景很象我見過的一對夫妻。妻子剛開始沒收入,移民後一直靠丈夫,後來通過自己努力加上一些無法仿製的小技巧,終於找了一份工作,收入雖不高但令她滿意了,每天打扮的漂漂亮亮。家庭所有開支還是男的花,女的掙錢自己留著買花戴。倆人後來漸漸掰了,女的天天逼問為什麽,吵得聲音很大,男的直接說我不信任你了,你有外遇,你說什麽話我都不相信是真的,你老騙我,你把我當傻子騙。。。女的每次聽到這,都把嘴撇到耳根,“你就是嫉妒我了!你看我有本事了,你容不下了!你心眼比針尖都小!我一天比一天強,你怕我超過你,所以你找我的麻煩,憑什麽我隻能被你壓著啊,你就是嫉妒就是嫉妒就是嫉妒。。。”反正翻來覆去就認定一個,就是嫉妒。嗬嗬。

 “我那麽好,你怎麽還能看不上我呢?你給我的理由一定都是借口。你就是。。。”,總覺得對方跟你說的不是實話而是找借口,本質是對自己心理的反射。他自己是滿嘴跑馬車的人,每次對別人都是心口不一,表麵工夫,才會覺得別人也都是這樣。

活在自己構建的認知裏,行為舉止很容易令別人發笑。北方人管這叫‘二百五’。自我認知,自我解釋,自說自話。“我比你們都強!”,見沒人理,又拋一句“我這麽優秀!你們都得誇我!”,見沒人誇,又拋一句“你們欠我一個道歉!”,還沒人理,“我病了都是你害的!你趁我不注意給我投毒!你壞壞壞!”,這回有人理了,別人被激怒了。“哼,你看我說的沒錯吧,你一直是恨我的,妒嫉我的,亡我之心不死的。看你惱羞成怒,就知道我這招用對了!”。。。活在幻覺裏好啊,雖然這幻覺不是抖音造出來的,但效果比抖音的還強。

抖音強大的量身定做功能,已經強大到了給你營造的幻覺,和給你同伴營造的幻覺完全不同,給一群不同的人,推送不同的感受。這誰不怕啊。這離科幻小說裏描寫的,把人大腦打開植入芯片,讓你成為他唯命是從的奴隸,隻差一步了。給你看‘社會主義好’的東西,給另一撥人看‘資本主義好’的,兩個群體不能看到對方能看到的內容,想搜都搜不到。然後隻需在相互仇恨的群體間稍加引導,一個社會就翻天覆地了。誰不怕啊。你掌握了我所有,掌控了所有,你讓我相信你不會對不起我的,而你之前對我說過不止一次的慌,你還要我一如既往地相信你。那些為此辯護的人,換你,你會相信這樣的人,這樣的國家麽?華為在美國聽證會上,真誠地說“相信我,我不會把美國人的數據交給中國政府的。”對方說“可是中國法律規定公司有義務提交的。”華為再次說“我不會的”,對方立即說“那你不就違反中國法律了麽?” 華為頓時無言以對。抖音沒遇到這樣的詰問,有的話情形也類似。你委屈,“美國憑什麽懷疑我!我又什麽都沒做!”,等你做了,一切都晚了。人家憑什麽不懷疑你呢?就憑你沒膽量違反中國那條法律,你就什麽也別說了。有粉紅說你以為美國高科技公司就不賣你的數據,就不把你的血型DNA交給FBI 麽?幼稚!我想說我當然知道不管哪裏高科技公司都會收集用戶大數據,但如果非要選的話,我隻能選給泄漏販賣數據設置障礙的那個,政府部門權力小的那個。要你數據的人,從提出申請,到法庭批準,到辦好各種規定,參與的人越多,環節越多,數據越安全。AI 大數據時代,沒有絕對安全的,人類還沒有這樣的智慧去發明這麽完美的製度,可至少,那個一拍腦門你的所有信息就被顛顛地送到跟前的,是一定要遠離的。

[ 打印 ]
閱讀 ()評論 (14)
評論
一覽青山 回複 悄悄話 讀了兩遍了,寫得好,錚錚有聲。
抖音沒接觸過,在youtube和微信裏看到過幾次小視頻,覺得就是低級搞笑的提不起興趣。博主對抖音講的很仔細,這些分析感覺是要加入抖音才會體會得到的。
markyang 回複 悄悄話 有關數據采集部分寫得非常到位,比如美國是嚴格禁止非法采集13歲以下孩子信息的,YOUTUBE上傳視頻時都有嚴格區分,但是抖音在中國是不是會采集13歲以下孩子信息,我想會的,當然TIKTOK估計在美國不敢違法,所謂AI,需要海量數據不斷去優化,這個的確是中國公司在中國做生意的優勢,但是也是他們出海的劣勢。因為數據太容易獲取,不需要擔心後果,AI算法的一些細節最後其實是完全靠數據來優化,一旦沒有足夠多的數據,很可能就會算法失靈了。
markyang 回複 悄悄話 有關數據采集部分寫得非常到位,比如美國是嚴格禁止非法采集13歲以下孩子信息的,YOUTUBE上傳視頻時都有嚴格區分,但是抖音在中國是不是會采集13歲以下孩子信息,我想會的,當然TIKTOK估計在美國不敢違法,所謂AI,需要海量數據不斷去優化,這個的確是中國公司在中國做生意的優勢,但是也是他們出海的劣勢。因為數據太容易獲取,不需要擔心後果,AI算法的一些細節最後其實是完全靠數據來優化,一旦沒有足夠多的數據,很可能就會算法失靈了。
wumingwuxing 回複 悄悄話 哈哈,中宣部,外交部,國安局都要找你喝茶。
太空風 回複 悄悄話 好文,讚。
jntul 回複 悄悄話 中國人的強項在於非常善於學習,因此解決問題能力很強,但不善於提出問題。而創新需要能夠提出問題,所以中國人創新能力不強。這是因為中國的文化,製度,學校教育方式不鼓勵提問題,甚至壓製不同的聲音
一覽青山 回複 悄悄話 寫得非常好,明天再仔細看。
晚妝 回複 悄悄話 回複 'balalacoin' 的評論 : 我沒說它和學校學的數據結構有關係啊。關於技術,我覺得不用高估或低估哪邊,我認為兩邊的水平是勢均力敵的,不會出現中國甩美國幾條街象有些人說的美國落後中國二十年的情況。因為技術不是你有多勤奮加上聰明加上巨資投入就會領先的,它有文化傳統和體製的關係。有些製度能刺激出天才,有些隻能在不可持續的領域裏刺激出創新的人才。
SabrinaD 回複 悄悄話 The author knows nothing about algorithms, especially deep learning. Another over-confident blabbermouth...
山韭菜 回複 悄悄話 原來這麽厲害,學習了!問好晚妝!
遠涯 回複 悄悄話 分析透徹深刻
balalacoin 回複 悄悄話 抖音的算法跟本科生學的數據結構沒有一毛錢的關係。前者叫深度學習,玄學的一種,業內人戲稱為煉丹術。後者是確定性的數學式表述。不要迷信美國的IT公司,也不要低估這一代中國年輕人的才華和勤奮。美國這幾個大公司裏以阿三為主體的研發隊伍,真的打不過同等規模的中國團隊。
黑貝王妃 回複 悄悄話 晚妝這篇對我來說有掃盲作用,雖然看完還是盲的,但對抖音的厲害略知一二了。什麽算法和大數據我都不懂,被時代淘汰的感覺,再讀一遍,學習!
6ba6 回複 悄悄話 頂!
登錄後才可評論.