我最近負責組裏predictive scenario 的測試工作。可是手裏沒有足夠的用戶數據, 特別是CRM 方麵的市場和銷售數據。目前排在第一位要測試是logistic regression, 想請問各位大師,怎麽樣可以找到足夠量的好的數據呢。
足夠 --- 我想知道如果早測試一個implementation 的 performance, 多少數據叫足夠? 好 --- 我想知道對於logistic regression來說, 什麽樣的數據分布是好的,我又怎麽判斷呢?
我知道數據還要經過處理,比如說,年齡要變成年齡段, 這個處理我會自己做。我需要原始的市場和銷售的數據。 請各位指點於我。 謝謝。