古希臘Pythagoras說過,萬物皆數。
早期計算機語言,Fortran和lisp,介於不同的理念。Fortran認為最基本的是number,而LISP認為是函數公式function。所以產生了2種不同的語言,Fortran以變量為基礎,任何結果從基本的幾個變量得到,而LISP以function為基礎,任何結果都從不斷調用函數得到。
後來發現,這些都不能解決實際問題。最重要的是Data,所以產生了Set language,以Edgar Codd的Relational 數據上的SQL把幾乎所有的應用程序都是建立在 Data driven之上的。但是SQL的問題在於一是速度慢,二是不能處理非結構性數據,所以NoSQL的大數據開始興起,Data mining從cube分析轉向大數據。人工智能從以前以為的算法問題,轉化成數據問題。現在的人工智能,machine learning, deep learning,都可以囊括在data science裏麵。data science概念的外延不斷擴大,幾乎無所不包了。
另外,大學裏麵的data science學不到什麽,頂尖的都在工業界。Data science的重大進展幾乎都是工業界做出的。