信息來源?

回答: 關於Cgpt 的幾個問題笑薇.2023-02-10 06:47:12

ChatGPT的訓練數據包括: OpenWebText(開源版本),數據是從Reddit論壇上收集的URL,再把內容抓取下來。Common Crawl(一個開放的互聯網數據存檔)。其他數據包括Wikipedia維基百科,Books開放圖書,Stack Exchange技術問答社區,Github 代碼,ArXiv論文,RealNew新聞存檔,PubMed數據.....等,共300 billion words。

請您先登陸,再發跟帖!