俺此時在診所等醫生助理,那就隨便扯扯吧。我不是做數據的,所以也就是作為一個外行人胡扯一下。openAI 作為一個語言輸出結合文字分析模型, 也就是一個正當壯年, 但是絕對活不過二十年。這個平台,和穀歌在竭力完善它的算法,成為領域寡頭之後,這個技術方法,也就是幾十年的壽命無異。
為啥這麽說呢?原因很簡單,因為未來的大數據大部分不會是文字數據, 而是視頻數據。因為我不知道視頻數據和文字數據的結構以及分析學習的算法需要怎樣的不同,但是可以肯定的是,如果需要在未來二十年以後,還要在大數據獨居鼇頭的話,任何模型需要處理的該是短視頻或少量的長視頻數據。
為啥我這麽覺得呢?因為博客或普通網頁那時早已日落西山,就算存在,也是老舊無人打理的幽靈網頁。活躍的網頁,也早就從閱讀量巨大的html模式變成了圖片或小視頻的聚集點。起碼我看我娃和她們的朋友們,如果他們將來還有人寫博客,那真的是老古董,要被人笑死。而現在每天新的上來的短視頻,那真是數據驚人。同時我近來通過穀歌搜信息時,越來越發現浮上來的前幾條,都是視頻。這在三年前,是不可以想象的事情。而那時,我們也還隻是在慢慢習慣於穀歌的語音輸入。
也許最簡單的處理就是直接把視頻數據轉換為語音數據,然後可以使用同樣的算法,但是這樣學習肯定學不過對語音和圖片數據的同步分析模型吧。
我也就胡扯一下,哪位數據大拿看到了,有空的話指教一下視頻數據如何學習。