今天在GenAI有關的會議,有個專場講到今後趨勢。今天GenAI需要的數據,80%靠data science engineer, 20%靠工具,趨勢是80%靠LLM,20%靠engineer。
喜歡CS,專業還是CS好。
data science 專業慎重。
一家之言,僅供參考。
==================================================================================
雖然主貼說了一家之言,也難免有爭議。在紫檀說話不容易,特別是適用普娃,不適用牛娃的話。牛娃之所以是牛娃,任它風吹草動,永遠都能成功。對普娃來說,減少信息差,打破信息壁壘,也是一種有效的風險控製。家有普娃,更甚有醬油普娃,對此深有感觸。
=== 把後麵的跟帖提上來
=== CS是不是也沒用?AI都能生成code了
現如今最火的AI,屬於GenAI(
的類別,比如CHATGPT。GenAI嚴重依靠海量的數據和數據的準確度。這就是為什麽Chatgpt可以寫文章,因為可靠的用來學習的文章是海量,從有出版開始到今天網絡,有幾百年的文章都可以用來學習和參考。為什麽AI可以寫code?因為開源代碼的存在,各種考編程的題庫,還有各種論壇中討論和分享的code。有題庫就有答案,有成功項目的source code就能夠判斷什麽是可行的code,這些都是可靠數據,可以用來學習判斷,可以AI化。還有為什麽AI考Step One可以通過,是一樣的道理。Step One考試,依靠是現存的知識,特別是記憶的比重還是很大的。那麽AI真可以替代CS嗎?目前還沒看到。每家公司的應用有大眾性的場景也有特殊的場景,大眾場景的AI可能可以提供,這是基於既然是大眾場景,那麽場景數據也是大眾的,可得到的,可判斷的,而且夠多夠海量。但是特殊場景AI沒有可依靠的大量數據用來學習,這還是需要人工來思考設計。
這裏做CS的不少,過去三十年,在CS field還做30年前同樣技術的,真是如熊貓般稀有啊。我清點一下自己早期做過事,現在的CS孩子估計聽都沒聽說過,比如AS400,比如聽得到噠噠噠信息傳輸的IBM token ring, 比如有個叫PASCAL的古董編程語言。同樣,三十年前的我,也不可能知道今天的ChatGPT,BARD, Bedrock的運行原理。CS從業就是不停的跟著技術,緊跟技術的步伐。新人入行入到就行。以後靠個人努力。CS行業需求永遠是存在的,隻是我們沒有水晶球,可以看到未來。一個技術的淘汰,總有幾十個新技術誕生。
如果在DS火的時候,選這個專業順利畢業入了行,即使這個職位沒了,自然有新的職位可以轉。而現在在高中的孩子,知道一下趨勢,還是有用的。
===============================================================================
Data Science 作為正式的本科專業是非常短的時間。2018前後,各大TOP University才相繼開出這個專業,然後遍地開花。而第一批DS專業的孩子畢業時,大數據紅利已接近尾聲。我們幸運的是,大數據泡沫沒有爆。市場充足的資金,讓這個新技術直接無縫連接到GenAI。 在大數據紅火的時候,MIT和Standford都是最早提供相關的Online program(Coursera - S 和 edX - MIT) 。
然,DS本身發展速度非常快,淘汰的也快,比如Hadoop,眼看他起高樓,眼看他樓倒了。DS類知識,更合適用提供即時緊跟技術的選修課或者是給從業的技術人員,更新技術培訓的方式,而不是一個新本科專業的設立。當然這隻是我個人意見。MIT好像至今都沒有DS專業,但是有很多相關課程。Standard有DS專業,但好像在統計大類之下。(由ChatGPT 提供)
再強調,對牛娃來說,任他風吹雨打,我自橫牛。所以就讀各TOP XX DS專業的牛娃都無妨!牛娃父母可以輕鬆ByPass本帖。嗬嗬。。。。。。
普娃選專業,請慎重考慮。自謙類普娃請參看上麵一行。