ChatGPT的訓練數據包括: OpenWebText(開源版本),數據是從Reddit論壇上收集的URL,再把內容抓取下來。Common Crawl(一個開放的互聯網數據存檔)。其他數據包括Wikipedia維基百科,Books開放圖書,Stack Exchange技術問答社區,Github 代碼,ArXiv論文,RealNew新聞存檔,PubMed數據.....等,共300 billion words。
ChatGPT的訓練數據包括: OpenWebText(開源版本),數據是從Reddit論壇上收集的URL,再把內容抓取下來。Common Crawl(一個開放的互聯網數據存檔)。其他數據包括Wikipedia維基百科,Books開放圖書,Stack Exchange技術問答社區,Github 代碼,ArXiv論文,RealNew新聞存檔,PubMed數據.....等,共300 billion words。
WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.
Copyright ©1998-2024 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy