看到data science 首先要問的是這個問題:
Is data science to be understood as the science of data, or as science with data?
其實兩者都包含,發明牛逼的工具來處理data,然後從data中獲取有用的知識,反過來再推動工具的發展。
Data science is concerned with all aspects of the creation, management, analysis, and communication of data focusing particularly on the application of computational methods to digital data。
說白了就是data science的目的就是為了從 data 中獲取有用的知識。
Data science = Data Curation + Data Analytics,在實際中,人們花費了大部分人的人力金錢和時間在data curation, 我知道花了大概 80% 時間在處理數據上。
由於data science的範圍太廣了,所以它的工種也是萬千種,大家崇拜的 ML/AI也可以歸到data science.
Data science並不像紫檀理解的那麽低門檻,相反相當的高大上。沒有好的data,ML/AI喝西北風。