RAG(Retrieval-Augmented Generation)
流程:
Word Embeddings/Sentence Embeddings
- 信息检索(Retrieval): 8-10. 给定一个查询,系统首先从一个大型文档库中检索出与查询相关的文档或段落。
这一步通常使用嵌入技术和相似度计算来完成。 - 生成(Generation): 13- 15. 生成模型(如GPT-3、T5等)接收检索到的信息作为额外的上下文,并根据这些信息生成更准确、相关的响应。
解决的问题:
1.LLM 数据更新问题
2.数据安全问题
3.幻觉
局限:
1:无法处理隐含关系(推理).A的所在部门销售
2:全局推理缺陷
GraphRAG(仍有缺陷)
VS SFT
Ollama:
Ollama是一个开源的大模型管理工具,它提供了丰富的功能,包括模型的训练、部署、监控等。 通过Ollama,你可以轻松地管理本地的大模型,提高模型的训练速度和部署效率。
- 此外,Ollama还支持多种机器学习框架,如TensorFlow、PyTorch等,使得你可以根据自己的需求选择合适的框架进行模型的训练.同时提供模型仓库
Hugging Face
Hugging Face Hub 是一个协作平台,其中托管了大量的用于机器学习的开源模型和数据集,你可以将其视为 ML 的 Github。该 hub 让你可以轻松地找到、学习开源社区中有用的 ML 资产并与之交互,从而促进共享和协作
GGUF(GPT-Generated Unified Format) 大模型文件标准格式之一
AnytingLLM
LangChain
LangChain 的核心是一个开发环境,通过使用抽象方法简化 LLM 应用程序的编程:将一个或多个复杂流程表示为封装所有组成步骤的命名组件