(引用請事先征求作者同意)
先說說學BI需要學哪些內容:
1.數據庫。
總的說任何學一個大型數據庫就可以了,因為概念是相通的。但你要學Informatica或Datastage的話學Oracle或DB2比較對口,如果你學MS的話那就是SQL Server了。主要區別是管理可客戶端工具不一樣,有的數據類型有點不同,不同數據庫的的功能也有些小區別。我們不是作DBA所以把數據庫的大的原理功能搞清楚最重要。
2.SQL.
標準SQL是一定要知道的,不同數據庫NATIVE的SQL的強大和特別的地方也要有一定的了解。
3.Data Model.
這個一定要有所了解,一張數據庫模型圖出來你要能看懂。最好能熟悉一種建模工具象ERWin.
4.數據倉庫理論
BI體係是建立在數據倉庫的理論基礎上的,所以一定要了解數據倉庫理論,包括星型結構,De-normalize, slow-changing dimension. 推薦看兩個人的書:ralph kimball 和 william inmon. 這兩人可是數據倉庫兩大門派的創立者,象SAP BI是基於Inmon的理論,同時Inmon也是SAP BI的總顧問,Inmon說什麽SAP就實現什麽。
5.ETL工具和報表工具(可選一個學)
這個就不多說了,前麵那麽多篇裏盡說這個來著,再說你就要打磕睡了。
6.UNIX
如果你想做ETL(非MS ETL),你還需要學點UNIX/JCL 的知識。
就這麽多,學完這些自己再做一個小的項目你就可以整理簡曆看看哪個苯蛋第一個吃螃蟹了。
你應該發現了, BI的學習關鍵是數據庫,其實說白了BI就是整天把數據折騰來折騰去的,所有的工具就是幫你來折騰這些數據的,無論你做ETL還是報表,都要對數據庫和數據結構有一個很好的理解能力,不然你的BI工具學的再精你也不知道如何開始。先把學習精力放在數據庫和數據結構上。
數據庫和數據結構的問題解決後就是解決BIG PICTURE的問題(前段時間誰問BIG PICTURE的問題來著?)。高更傳世名畫的標題《我們從哪裏來?我們是誰?我們往哪裏去?》 就能回答BI的BIG PICTURE的問題。"《數據從哪裏來?數據是誰?數據往哪裏去?》". 對BI來說BIG PICTURE就是我的數據源有哪些在哪裏,要放到什麽地方去,中間有哪些層次,每一層次是幹什麽用的,用到什麽工具和技術,最後如何去使用和消費(consume)這些數據。數據倉庫理論就是幫你解答這些問題的鑰匙!
把以上問題搞通了,那你就一頭紮進BI工具的學習吧!
另外說幾句多餘的話,有些朋友問到到底是該選ETL方向還是數據分析方向?這裏多說兩句,希望能解答大家的疑問。
如果你有一定的電腦編程或數據庫基礎,邏輯思維能力強,喜歡工作單純點,英語不是特別的STRONG,你毫無疑問應該把ETL作為主要方向。
如果 你的電腦基礎不是很強,或者對電腦編程不是那麽有興趣,同時你對公司的業務層麵的東西領悟能力很強,英語和交流溝通能力很強,那你就該選數據分析方向。數據分析不是說一點代碼都不寫,隻是很少,大部分代碼還是寫FORMULA。