騎樂無窮

上帝不響。如歌單車。
Tune Your Ride. Every Day. Amen.
"Bicycling: Big Brainpower Booster."
個人資料
stillthere (熱門博主)
  • 博客訪問:
歸檔
正文

四大開源商業智能平台大比拚

(2010-01-01 11:00:22) 下一個

本文從對方麵對四大開源商業智能平台進行了比較……

首先看一下它們各自的網站

  openI

  

  openI的 站點就是屬於典型的開源站點,簡潔,不像是一個商業公司的站點。但有一件很有意思的地方,看到左上角的圖片,“盲人摸象”。不知道是不是openI 裏麵有人覺得這幅畫很能表現商業智能現在的狀態。

  JasperSoft

  

JasperSoft的網站算是非常典型的商業公司。而且首頁做的非常的好。顏色的色調比較統一,商標簡潔,圖像選擇具有代表性,列出了

  products,service,news,customers,community, 不過個人覺得中間圖像的一行字:community ,download products,buy now ,要麽放到上麵,要麽放到下麵,放中間位置不太好,個人感覺吧。

  SpagoBI

  

  spago網站的整體感覺就比JasperSoft差一點,不過布局方麵更好一點,有一個站點導航,原因是你看到的這個頁麵是spago的cms的一部分 。

  pentaho

  

pentaho的網站也是典型的商業公司的網站,而且是典型的美國的那種商業公司,當然這隻是個人感覺,整個網站相當的漂亮,無論是顏色搭配,圖片選擇,界麵布局,導航條的交互,還是商標,注意一下右下角的jolt 大獎,權威的象征呀,軟件的奧斯卡呀。

  一個好的項目總是有很多的文檔,一個失敗的項目總是有各種理由沒有文檔或很少的文檔。所有我們有理由來比較一下四個平台的文檔。

  openI的文檔

  openI的項目相對來說比較的小,文檔可能也少一些,

  Installation DocumentAs Mick Jagger would say -- "Start me up"

  User GuideInstructions on creating/modifying analysis

  Architecture OverviewOh yeah, there was some design work

  Java DocOh yeah, there is internal documentation

  文檔雖少,主要的都有了,實際上,這也是每個項目都應該有的文檔了,java doc文檔實際還是很必要的,方便查詢API。

  jaspersoft的文檔  

分類

描述

數目

Books 
Books on JasperSoft solutions for sale.
7
Report Samples 
Sample reports typically include the jrxml, html, images, and/or pdf showing result.
11
Articles 
Technical articles from around the globe on JasperSoft products
21
JasperServer 
Documentation for JasperServer
10
iReport 
Documentation for iReport
14
JasperReports 
Documentation for JasperReports
8
JasperETL 
Documentation for JasperETL
2
JasperSource Tips and Tricks 


8

  Jaspersoft的文檔不可謂不多,而且集中在report上,大家也都知道,JasperSoft的jasperreport是業界領先的一種報表方式。而iReport則是jasperReport的設計器,好的report都是有自己的設計器的,因為報表的種類很多,不可能把所有的情況都考慮到,所以想要需要自己的設計器。相對於國內的智能平台,光報表這方麵來說的話,就沒有自己的設計器,所以要想開發一些新的報表樣式就得定做,而且不容易管理,修改。所以設計器還是很必要的,無論是做成RCP還是web形式。

SpagoBI的文檔

  How_To—1.6.doc.zip

  How_To—1.6.pdf.zip

  QuickStart—0.9.2.doc.zip

  QuickStart—0.9.2.pdf.zip

  SpagoBI_JBoss_Installation_Manual-1.4.3.doc.zip

  SpagoBI_JBoss_Installation_Manual-1.4.3.pdf.zip

  SpagoBI_JOnAS_Installation_Manual-1.4.3.doc.zip

  SpagoBI_JOnAS_Installation_Manual-1.4.3.pdf.zip

  SpagoBI_eXoTomcat_Installation_Manual_1.4.3.doc.zip

  SpagoBI_eXoTomcat_Installation_Manual_1.4.3.pdf.zip

  spagoBI的文檔隻有怎麽安裝的,關於它的組件的文檔相對就少了,可能是開發著文檔隻有在進入他們的社區或者是在社區開發者內部才有的吧。順便說一下,spago本身還有自己的cms , portlet , workflow.實力絕對不容小看。

  pentaho的文檔

  pentaho的文檔也非常的豐富

  Pentaho Getting Started Guide

  Pentaho AJAX Guide

  Pentaho Security Guide

  Pentaho Subscriptions

  Software Quality Reports for Bugzilla Getting Started Guide

  Software Quality Reports for Bugzilla Solution Documentation

  Pentaho Cube Designer User Guide

  Pentaho Creating Solutions

  Pentaho Data Mining Experimenter Tutorial

  Pentaho Data Mining Explorer Guide

  Pentaho SDK

  Pentaho Advanced Installation Guide

  Pentaho Customizing Deployments

  Pentaho Advanced Reporting Guide

  Pentaho Component Builder's Guide

  Pentaho Dashboard Builder's Guide

  Pentaho Internationalization Guide

Pentaho BI Design Studio User Guide

  Pentaho Report Design Wizard User Guide

  Pentaho Report Designer User Guide

  Pentaho Report Bursting Guide

  Pentaho Jasper Report and BIRT Integration

  Pentaho Using System Actions to Control Data Access

  Session and Global Filter Guide

  pentahoPentaho Report Design Wizard User Guide 和

  Pentaho Report Designer User Guide 是針對Pentaho Report Design的,一個基於eclipse平台的報表設計器。和jaspersoft一樣,它把報表跟報表設計器飛開了,spagoBI好像是沒有單獨的報表設計器。它都是集成在一個WEB平台裏麵的。

  Pentaho AJAX Guide 是它自己的一個AJAX工具包的開發文檔,從pentaho網站的漂亮程度看的出來。Pentaho對於美觀還是非常的注重的。

  Pentaho Cube Designer ,Pentaho Data Mining , Pentaho Dashboard Builder's ,Pentaho Internationalization , Pentaho BI Design Studio 則是它的各個組件的開發文檔。對於國際話還有專門的文檔,看來pentaho 在開發的一開始就沒打算之針對英語市場,spagoBI也有國際話,cms和portlet都應該有吧,jaspersoft有沒有我就不知道了,pentaho也和另外的報表有集成,Jasper Report and BIRT Integration ,也算是業界主流的報表吧,spagoBI也跟其他有集成。

  OpenI的demo

  OpenI提供下載的demo隻有一個,在線演示的有兩個,下載的一個是叫foodmart 。

  需要mysql.部署起來相對比較麻煩.至少花了我十分鍾.然而在實際的生產環境中.部署openI是最快的,因為它的組件相對較少,貼兩張在線演示的圖片。

  

  

  下麵的灰色比較難看的表格就是JPivot的,的確是很牛的一個項目,不光是技術,關鍵是界麵的顏色,後麵介紹pentaho的時候也會提到的。

JasperSoft的Demo

  JasperSoft的Demo要先注冊才能下載

  Welcome to the JasperReports demo. JasperSoft and VMware have partnered together to create a virtual application showcasing JasperReports, the world's most popular open source reporting engine. The VMWare image contains a sample web application showing how JasperReports can be used to add reporting to any application. This sample is using SugarCRM as a data source, but can be used with other applications data as well.

  To get started, please fill out the brief form below and you will be taken to the download area.

  做成VMware的,那Demo部署起來就不用一分鍾了,隻要你裝好了VMware.放就是了。

  它自己本身還有一個宣傳片.是做成Flash的.貼幾張圖(Ad Hoc是點對點的意思)。

  

  

jaspersoft的VMware的Demo 讓我很奇怪,848M的東西,裏麵的隻有一個SugarCRM的Report的Demo, 跟我看他們宣傳的Flash那個版本不一樣。相信JasperSoft本身的能力絕對不是這個Demo裏麵的這樣。

  

  

  spagoBI的Demo

  spagoBI的Demo部署起來也非常之快.下載spagoBI demo和eXoPortal-tomcat-1.1.3.別先啟動tomcat.把一個往另一個覆蓋.啟動sbidata裏麵的HSQL,啟動 eXoPortal,按照Readme裏麵的網址打開瀏覽器就夠了,我個人部署的時候是沒問題.可是OLAP進去就報錯,其他的都沒問題,幸好它還有一個在線的Demo。

  而且難能可貴的是它還有十個tutorials,是Flash的,而且還是分階段介紹的。

  不得不說這給我留下了太深的印象了,一千個字也許沒有一個圖片更能介紹清楚的,一百個圖片也許沒有一個Flash更能介紹清楚的了,也許 SpagoBI的平台知名度比JasperSoft的和Pentaho的要少的多.但是這十個Flash的確證明了他們團隊對於平台的推廣下了很多的功夫的。

技術再好,也要讓別人知道才有用

  JPivot的多維查詢,SpagoBI也拿界麵沒辦法。

  

  jfreereport和jaspersoft報表,也有BIRT的。

  

  DashBoard

  

Data Mining

  

  多維查詢條件選擇

  

  pentaho的Demo:

  主頁

  

點左邊餅狀圖,右邊的數據會跟著變,pentaho認為這個就是它們的DashBoard了,跟SpagoBI的比差了一些。

  本次的主角登場了。pentaho裏麵的JPivot,一樣的灰色,一樣的菜單。

  

  JFreeReport

  

pentaho認為的DashBoard

  

  GEO的搜索,spagoBI也有,不過好像沒有這麽強大。還跟google map的API 結合了,易用性又高了一點,

  

  各種不同的報表,畢竟報表是BI的最初也是最重要的一環。

  

pentaho的殺手應用,Mondrian + JFreeReport .數字沒對好。要扣分的。

  

  Demo 的BI Platform是在JBoss Portal上的。不過要說明的是pentaho本身是平台無關的,無論你是在tomcat,jboss,weblogic,你選用哪種portal都一樣,數據庫支持的很多,Hibernate做的,隻要你有JDBC驅動。

  中間空的會不會太大了一點,下麵倒是中規中矩的portal 。

  

  換了個theme後的portal,漂亮多了,平台的顏色是一致的。

  

後台管理界麵,跟SpagoBI一樣,有耗時比較長的任務都是放在後台運行,運行完了才有提示,都是用quartz做的。

  

  運行報表時的sql,Demo是在HSQL平台。SQL也是中規中矩的SQL 。

  

openI

  首先看openI的體係結構:

  

  RDL是Report Define Language 。

  openI具有一個BI應有的大部分特性了。

  report : jasperreport ,JFreeChart

  olap : mondrian + JPivot

  data mining: weka

  它的各層銜接的非常的緊,好像用了eigenbase做數據管理,不是很清楚這部分,openI在做數據挖掘的時候它沒有調度器,它的Portlet Interface 主要是指在用JPivot的時候JPivot可以到處使用。

  openI沒有自己的開發專屬工具,入門門檻也相對較低。

  JasperSoft

  

JasperSoft最重要的就是它的報表,但是它支持輸出的格式很多,管理的方式也很多,也用了eigenbase做數據管理。有比較完善的權限控製,用的acegi,支持多種數據源,隻要有JDBC驅動。

  它的產品已經形成了一個產品線,最著名當然還是它的JasperReport。

  你可以看到它為了更好的管理各種報表和數據,有自己專屬的展現平台JasperServer,這個平台是 06/26/2006才創建的,完全是JasperSoft為了實現BI而邁出的重要一步。jasper沒有數據挖掘。有任務調度器,用了quartz。有自己專屬的ETL: JasperETL 。它有自己的OLAP SERVER : jasperAnalysis 。展示層用到了AJAX和applet, 也有DashBoard。查詢語句支持SQL, Hibernate (HQL), XPath (XML), EJBQL, MDX(多維查詢語言,OLAP專用,SQLSERVER用的是XMLA)

  SpagoBI

  

  spagoBI平台厲害很多,也複雜了很多。它的各個組件之間模塊化很好,Plugin加載,來看一下它的各個組件:

  report : BirtReportDriver , BirtReportEngine , JasperReportDriver ,JasperReportEngine

  GEO : GeoDriver , GeoEngine(用地圖顯示數據和查詢的)

  OLAP : JPivotDriver , JPivotEngine

  QBE : QbeDriver, QbeEngine

  Data Mining : WekaDriver , WekaEngine

  Security : ExoPortalSecurityProvider

  Booklet (小冊子) : BookletsComponent: it is a component for booklets generation.主要包括文件上傳,工作流,OpenOffice支持。

  它還有文檔管理,用的是apache的JackRabbit,有搜索功能,用的lucene.不愧是做cms,portlet,workflow出身的,技術就是牛。

  spagoBI的使用的工具也比較多:

  Report : Bird , JasperReport

ETL : Octupus 和 talend (talend是官方合作夥伴)

  OLAP : Mondrian 和 JPivot

  Data Mining : Weka

  Portal : eXoPortal

  它的展現層也使用了AJAX特性,另外它在DashBoard也使用了openlaszlo,(一個用Java code 生成Flash的框架,主頁是http://www.openlaszlo.org/。新版的4.0好像也要支持生成DHTML) 所以spagoBI的DashBoard看上去很爽.。

  spagoBI的ETL是非常之牛的。你可以看到它下麵的數據處理層是單獨分出來的,至於為什麽牛,我在後麵ETL部分會專門提到的。

  還有一些很細節的東西,想BIPortlet,BIMessage , Notify ,Schedule , Workflow ,Rule Engine ,Profiling ,Analytical Document 我會在後麵盡量把我知道的說一下。

  pentaho

  

  pentaho的體係結構跟spagoBI非常相像,我甚至都沒看出來有上麵很大的區別,不過pentaho喜歡把自己的東西稱作 solution,以下引用自pentaho的whitepaper: “pentaho BI 平台不同於傳統的BI產品。它是一個以流程為中心的,麵向解決方案的(Solution)的框架,具有商業智能(BI)組件,使得公司可以開發商業智能問題的完整解決方案。

  pentaho一樣把數據處理層看的很重要,多種數據顯示方式,甚至有RSS輸出。pentaho是有各種開源組件組成的。

  ETL : Kettle (界麵上顯示的是pentaho Data Integration ,previously Kettle)

  Report : Pentaho Report (它也支持Birt 和 JasperReport 的集成 ,還有專門的文檔)

OLAP : Mondrian 和 JPivot (Mondrian已經加入了pentaho )

  Platform : Pentaho Planform

  Data Mining: Weka (Weka也加入了pentaho)

  roadmap是一個項目的計劃表,個人認為任何一個項目都應該有的,這樣你的developer能夠知道自己工作的項目處在什麽狀態,也不至於每天都在沒日沒夜的忙,卻不知道自己在忙什麽,這樣更能夠提高團隊的士氣。

  JasperSoft

  我找到的這一篇是November 2006的,找了半天也沒找到最新的,它是分各個不同組件的,我挑一些說一下:

  1 . Many components of JasperIntelligence are localizable. We are doing a pass through to make sure localization works at all levels.

  2 . Dashboards Multiple reports and OLAP components displayed in a single screen

  3 . Portal (JSR168) integration: portlets, security

  4 . Report data sources in all JR query languages, including Mondrian and XML/A

  5 . Scheduling Enhanced UI for scheduling management

  6 . JasperAnalysis Filtering views according to user profile, not just role

  7. JasperAnalysis Visual Schema Builder

  Visual MDX builder

  JasperETL是基於talend的,所以不在我討論之列。

  1 .可以看出jaspersoft的全球化的意圖,實際這也是每一個成熟項目都需要麵對的。

  2 .DashBoard是BI展現層技術比較集中的一個地方。我本身沒有看過jaspersoft的DashBoard。

  3 . portal是BI展現層不可避免要用到的技術,後麵我也會就portal專門有一個篇比較的

  4 . data warehouse 也是支持越來越廣泛。

  5 . 任務調度必不可少 。

  6 . 基於profile的參數控製也算是基於權限控製的另一種途徑。因為普通的權限控製不可能滿足BI的要求,太多的參數要管理了。

  7. Visual , Visual , Visual 不知道它的MDX怎麽做的,如果跟JPivot一樣就..................

  pentaho

  pentaho的roadmap,官方甚至說沒有commitment(許諾),仍然挑幾條:

  1. Accelerate dashboard creation by delivering a dashboard design tool.

  2. Business users will be able to select from subject areas predefined by administrator and apply filters (for example, certain time periods or product lines) to select the subset of information they need.

  3. Wizard-driven interfaces to streamline the deployment and optimization of OLAP cubes .

  4. Easily incorporate data from multiple sources into Pentaho Data Mining solutions via Pentaho Data Integration.

  5. Offer integration with Content Management Systems (CMS) to store and manage access to generated reports.

這是一個總的它的roadmap,它的各個組件還有各自自己的roadmap.

  1. 用DashBoard Design tool來做Dashboard,易用性又提高不少,pentaho喜歡把tool做成基於eclipse的tools,spagoBI則是喜歡模塊化的設計,都基於web + plugin模式.

  2. 預定義的filter,最後大家都可以共享和分發filter,有點像社交社區的功能

  3. 用wizard-driven的方式來建cube,OLAP的功能會越來越厲害的,JPivot的不爽的另一種表現(挑撥離間我最在行,開玩笑的,大家別當真)

  4. 我也不懂什麽意思,pentaho論壇上也有人問了,沒有回答

  怎麽集成的,怎樣data mining , 集成到哪了,kettle嗎?隻有等release才知道

  5. 終於還是要動用CMS來解決問題了,spagoBI在這點上領先一點.

  spagoBI

  spagoBI的roadmap看了會讓你非常的驚訝,為了表示我對spagoBI這個雄心勃勃的項目的尊敬,貼出全部roadmap(加了數字)。

  First half 2007

  Analytical engines and end-user functions

  1 ETL: integration of Talend OS tool

  2 OLAP: new OLAP engine for web based analysis or local spreadsheet elaboration - Integration of Palo/JPalo OS tool

  3 OLAP: new XMLA engine, to integrate MS Analysis Services

  4 QbE: profiling and filtering over data according to the behavioural model

  5 Dashboard: enrichment and new components

  6 Personal folders to storage private documents and the possibility of sharing them

  7 Personal menus of quick access to all kind of documents

  Developer/administrator functions

  8 Scheduler: production, distribution and storage of off-line reporting, deferred execution of documentary Dossiers, Mining or ETL processes

  9 Search engine

  10 Predefined set of metadata to implement frequently used time parameters (ex. current month, current year, current date)

  11 Self-analysis: analytical model developed with the SpagoBI platform on its own metadata. This model offers the developer/administrator the full visibility on the behavioural model and on the analytical metamodel managed by the platform.

  12 Rich client (Ajax) for the developer and administrator functions

  13 Designers: enrichment and simplification of the interactions with the platform for the development of the analytical documents

  14 Evolution of the platform towards SOA architecture

15 Metamodel

  Second half 2007

  Analytical engines and end-user functions

  16 Dashboard: new engine

  17 Subscription: capability for the end-user to enter himself to the periodic delivery of predefined reporting.

  18 Alerts and notifications

  19 Geo-referenced analysis: improvement of the current engine and integration of GIS solutions

  20 Navigation profile, to inherit settings during the vertical and cross navigation between the analytical areas and documents

  Developer/administrator functions

  21 Installer and end-user interface for the configuration of the environment

  22 Rich client (Ajax) for the developer and administrator functions

  23 Designers: enrichment and simplification of the interactions with the platform for the development of the analytical documents

  24 Evolution of the platform towards SOA architecture

  25 Metamodel

  Applicatory development areas

  * What-if

  * BPM

  有很多人認為 pentaho有多麽多麽厲害,證據呢?能告訴我厲害在哪些方麵嗎?這個roadmap也許會給你一個不一樣的答案pentaho宣傳做的很好,有 microsoft的風格,有什麽都展現出來,spagoBI更像是一個默默努力的developer,技術一流,不懂的展現自己。

  2和3是支持新的OLAP Server的,Mondrian可不是唯一的選擇。

  4. 跟pentaho一樣基於profiling,隻不過spagoBI有自己的behavioural model(行為模式) ,比pentaho厲害一點

  5 . pentaho的DashBoard注重在易用性方麵,spagoBI 則是強調在功能上

  6 和 7.pentaho的cms隻是一個plan,spagoBI已經在做private folder和共享文檔了,還有導航,技術又高一點.

  8. mining ETLprocess ,後麵我會在ETL的部分提到的

  9 . Search Engine 基於lucene的search,cms一部分

  10 .跟pentaho一樣,常用的查詢預先定義

  18. 用戶通知方式的加強.不知道會不會有 RSS的方式

  19 . GEO 的查詢快要和GIS集成了,十分期待,不知道會不會一樣引用Google的API或是仍然基於原先的SVG.

  21 - 25都是為用戶易用性和更好的用戶體驗做的增強.


[ 打印 ]
閱讀 ()評論 (0)
評論
目前還沒有任何評論
登錄後才可評論.