簡體 | 繁體

loading...

熱點論壇

全部論壇列表

謝謝。我朋友公司號稱做big data的top 100 USA company 之一，但其實後麵還是database queri

來源: 有可不可無於 2014-11-20 18:53:38 [檔案] [舊帖] [給我悄悄話] 閱讀數 : (64 bytes)

字體:調大/重置/調小 | 加入書簽 | 打印 | 所有跟帖 | 加跟貼 | 當前最熱討論主題

回答: Machine Learning。基於Java的有Spark/MLib， Mahout.Scala有點意思。其他的如語音圖像識由 easycity 於 2014-11-20 18:10:47

當然performance tuning 非常重要，但沒有什麽新東西

您的位置：文學城 » 論壇 » 職場生涯 » 謝謝。我朋友公司號稱做big data的top 100 USA company 之一，但其實後麵還是database queri

所有跟帖：

• 插入6千萬行數據進入一個表，Cassandra需2小時，同樣條件插入MYSQL需要36小時，完全不是一個級別的. -望鄉- ♀ (0 bytes) () 11/20/2014 postreply 20:07:55

• 大數據真的隻適用於新型的應用，TB級的數據，用戶在線等結果。Relational DB沒法承擔。Spark很好 -easycity- ♂ (267 bytes) () 11/20/2014 postreply 20:53:43

• 在SPARK麵前，HADOOP的MR太繁雜，效率太低，遠比上SPARK的線程操作。 -望鄉- ♀ (0 bytes) () 11/20/2014 postreply 21:01:07

• Spark比MapReduce快30到100倍。伯克利的作者成了MIT教授。推薦他的博士論文，寫得太棒了 -easycity- ♂ (74 bytes) () 11/20/2014 postreply 21:08:18

• 這是真正的大牛之一。在美華人不要多提印度人，有雄心就照著Spark作者Zaharia去幹。 -easycity- ♂ (0 bytes) () 11/20/2014 postreply 21:10:14

• 對！羅馬尼亞的加拿大籍小夥子，相當牛，老中應該學習之。 -望鄉- ♀ (0 bytes) () 11/20/2014 postreply 21:20:32

• 2小時vs36小時，不可完成的使命 -85858585- ♀ (0 bytes) () 11/25/2014 postreply 23:54:35

請您先登陸，再發跟帖！