0%

AI OverView

RAG(Retrieval-Augmented Generation)

流程:

Word Embeddings/Sentence Embeddings

  • 信息检索(Retrieval): 8-10. 给定一个查询,系统首先从一个大型文档库中检索出与查询相关的文档或段落。
    这一步通常使用嵌入技术和相似度计算来完成。
  • 生成(Generation): 13- 15. 生成模型(如GPT-3、T5等)接收检索到的信息作为额外的上下文,并根据这些信息生成更准确、相关的响应。

流程

解决的问题:

1.LLM 数据更新问题

2.数据安全问题

3.幻觉

局限:

1:无法处理隐含关系(推理).A的所在部门销售

2:全局推理缺陷

GraphRAG(仍有缺陷)

应用

VS SFT

对比微调
4

Ollama:

Ollama是一个开源的大模型管理工具,它提供了丰富的功能,包括模型的训练、部署、监控等。 通过Ollama,你可以轻松地管理本地的大模型,提高模型的训练速度和部署效率。

  • 此外,Ollama还支持多种机器学习框架,如TensorFlow、PyTorch等,使得你可以根据自己的需求选择合适的框架进行模型的训练.同时提供模型仓库

Hugging Face

Hugging Face Hub 是一个协作平台,其中托管了大量的用于机器学习的开源模型和数据集,你可以将其视为 ML 的 Github。该 hub 让你可以轻松地找到、学习开源社区中有用的 ML 资产并与之交互,从而促进共享和协作

GGUF(GPT-Generated Unified Format) 大模型文件标准格式之一

AnytingLLM

LangChain

LangChain 的核心是一个开发环境,通过使用抽象方法简化 LLM 应用程序的编程:将一个或多个复杂流程表示为封装所有组成步骤的命名组件

LlamaIndex

Dify

对比

Agent