檢索增強生成 (RAG) 是將信息檢索係統與大型語言模型 (LLM) 相結合的人工智能框架. RAG 通過提供對外部知識庫的訪問來提高 LLM 響應的準確性和相關性。
- 檢索相關文檔: RAG 查找與用戶查詢最相關的文檔。
- 增強查詢: RAG 將相關文檔添加到用戶的查詢中。
- 發送到 LLM: RAG 將增強查詢發送到 LLM 以生成響應。
- 準確性: RAG 提供可供用戶檢查以驗證聲明的來源。
- 成本效益: RAG 允許用戶更新源而無需重新培訓 LLM。
- 開發人員控製: RAG 使排除故障和修複應用程序變得更加容易。
- 數據主權: RAG 允許敏感數據保留在本地。