Machine Learning。 基於Java的有Spark/MLib, Mahout.Scala有點意思。其他的如語音圖像識

來源: easycity 2014-11-20 18:10:47 [] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (0 bytes)

所有跟帖: 

謝謝。我朋友公司號稱做big data的top 100 USA company 之一,但其實後麵還是database queri -有可不可無- 給 有可不可無 發送悄悄話 (64 bytes) () 11/20/2014 postreply 18:53:38

插入6千萬行數據進入一個表,Cassandra需2小時,同樣條件插入MYSQL需要36小時,完全不是一個級別的. -望鄉- 給 望鄉 發送悄悄話 (0 bytes) () 11/20/2014 postreply 20:07:55

大數據真的隻適用於新型的應用,TB級的數據,用戶在線等結果。Relational DB沒法承擔。Spark很好 -easycity- 給 easycity 發送悄悄話 (267 bytes) () 11/20/2014 postreply 20:53:43

在SPARK麵前,HADOOP的MR太繁雜,效率太低,遠比上SPARK的線程操作。 -望鄉- 給 望鄉 發送悄悄話 (0 bytes) () 11/20/2014 postreply 21:01:07

Spark比MapReduce快30到100倍。伯克利的作者成了MIT教授。推薦他的博士論文,寫得太棒了 -easycity- 給 easycity 發送悄悄話 (74 bytes) () 11/20/2014 postreply 21:08:18

這是真正的大牛之一。在美華人不要多提印度人,有雄心就照著Spark作者Zaharia去幹。 -easycity- 給 easycity 發送悄悄話 (0 bytes) () 11/20/2014 postreply 21:10:14

對!羅馬尼亞的加拿大籍小夥子,相當牛,老中應該學習之。 -望鄉- 給 望鄉 發送悄悄話 (0 bytes) () 11/20/2014 postreply 21:20:32

2小時vs36小時,不可完成的使命 -85858585- 給 85858585 發送悄悄話 (0 bytes) () 11/25/2014 postreply 23:54:35

請您先登陸,再發跟帖!

發現Adblock插件

如要繼續瀏覽
請支持本站 請務必在本站關閉/移除任何Adblock

關閉Adblock後 請點擊

請參考如何關閉Adblock/Adblock plus

安裝Adblock plus用戶請點擊瀏覽器圖標
選擇“Disable on www.wenxuecity.com”

安裝Adblock用戶請點擊圖標
選擇“don't run on pages on this domain”