請問各位大師,怎麽樣可以找到足夠量的好的數據

來源: 追書 2013-04-17 01:07:08 [] [博客] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (518 bytes)

我最近負責組裏predictive scenario 的測試工作。可是手裏沒有足夠的用戶數據, 特別是CRM 方麵的市場和銷售數據。目前排在第一位要測試是logistic regression, 想請問各位大師,怎麽樣可以找到足夠量的好的數據呢。
足夠 --- 我想知道如果早測試一個implementation 的 performance, 多少數據叫足夠?  好 --- 我想知道對於logistic regression來說, 什麽樣的數據分布是好的,我又怎麽判斷呢?

我知道數據還要經過處理,比如說,年齡要變成年齡段, 這個處理我會自己做。我需要原始的市場和銷售的數據。 請各位指點於我。 謝謝。

所有跟帖: 

根據忘光以前學的概率統計, -peterdu- 給 peterdu 發送悄悄話 peterdu 的博客首頁 (223 bytes) () 04/17/2013 postreply 07:51:04

有沒有公開的數據庫, 我可以拿來做基礎,來生成我的數據 -追書- 給 追書 發送悄悄話 追書 的博客首頁 (182 bytes) () 04/17/2013 postreply 07:59:23

Check an econometrics text book which has a cd for data, includi -zhuzhuhamster- 給 zhuzhuhamster 發送悄悄話 zhuzhuhamster 的博客首頁 (92 bytes) () 04/17/2013 postreply 18:26:35

你要是有個小樣本,就用bootstrapping做個大的出來 -小鳳仙- 給 小鳳仙 發送悄悄話 (86 bytes) () 04/17/2013 postreply 19:15:18

Agree. This is professional. -w1071- 給 w1071 發送悄悄話 (0 bytes) () 04/17/2013 postreply 23:37:44

就是模擬,也得有標準,采樣如果太可以接近 -peterdu- 給 peterdu 發送悄悄話 peterdu 的博客首頁 (49 bytes) () 04/18/2013 postreply 09:41:12

回複:你要是有個小樣本,就用bootstrapping做個大的出來 -追書- 給 追書 發送悄悄話 追書 的博客首頁 (166 bytes) () 04/18/2013 postreply 11:17:48

回複:你要是有個小樣本,就用bootstrapping做個大的出來 -追書- 給 追書 發送悄悄話 追書 的博客首頁 (166 bytes) () 04/18/2013 postreply 11:17:48

請您先登陸,再發跟帖!

發現Adblock插件

如要繼續瀏覽
請支持本站 請務必在本站關閉/移除任何Adblock

關閉Adblock後 請點擊

請參考如何關閉Adblock/Adblock plus

安裝Adblock plus用戶請點擊瀏覽器圖標
選擇“Disable on www.wenxuecity.com”

安裝Adblock用戶請點擊圖標
選擇“don't run on pages on this domain”