這是拜壇貼:想與同好討論切磋。 剛剛把 Hadoop 搞好(一個node),從 ebay 拍了兩台寡機器(總共~120 USD),準備把 cluster 搞好。下一步就是數據模擬 -- 模擬健康照顧行業都數據結構,然後展開數據分析。所有的結構和流程都在 Ubuntu 下。 有願意探討的嗎?