0%

AI OverView

发表于 2023-08-11 更新于 2024-07-24 分类于技术

RAG(Retrieval-Augmented Generation)

流程:

Word Embeddings/Sentence Embeddings

信息检索（Retrieval): 8-10. 给定一个查询，系统首先从一个大型文档库中检索出与查询相关的文档或段落。
这一步通常使用嵌入技术和相似度计算来完成。
生成（Generation): 13- 15. 生成模型（如GPT-3、T5等）接收检索到的信息作为额外的上下文，并根据这些信息生成更准确、相关的响应。

解决的问题:

1.LLM 数据更新问题

2.数据安全问题

3.幻觉

局限:

1:无法处理隐含关系(推理).A的所在部门销售

2:全局推理缺陷

GraphRAG(仍有缺陷)

VS SFT

Ollama:

Ollama是一个开源的大模型管理工具，它提供了丰富的功能，包括模型的训练、部署、监控等。通过Ollama，你可以轻松地管理本地的大模型，提高模型的训练速度和部署效率。

此外，Ollama还支持多种机器学习框架，如TensorFlow、PyTorch等，使得你可以根据自己的需求选择合适的框架进行模型的训练.同时提供模型仓库

Hugging Face

Hugging Face Hub 是一个协作平台，其中托管了大量的用于机器学习的开源模型和数据集，你可以将其视为 ML 的 Github。该 hub 让你可以轻松地找到、学习开源社区中有用的 ML 资产并与之交互，从而促进共享和协作

GGUF(GPT-Generated Unified Format) 大模型文件标准格式之一

AnytingLLM

LangChain

LangChain 的核心是一个开发环境，通过使用抽象方法简化 LLM 应用程序的编程：将一个或多个复杂流程表示为封装所有组成步骤的命名组件

LlamaIndex

Dify

Agent