RAG 分类

什么是RAG

RAG就是在向模型提问之前基于已有的知识库或文档内容做检索，确保向模型提问的内容更精准以及包含足够的信息量用以提供给模型。RAG（Retrieval-Augmented Generation）即检索增强生成，为大模型提供了从特定数据源检索到的信息，以此来修正和补充生成的答案。可以总结为一个公式：RAG = 检索技术 + LLM 提示。

RAG作用：

解决知识实效性问题：大模型的训练数据有截止时间，RAG 可以接入最新文档（如公司财报、政策文件），让模型输出 “与时俱进”。
降低模型幻觉：模型的回答基于检索到的事实性资料，而非纯靠自身记忆，大幅减少编造信息的概率。
无需重新训练模型：相比微调（Fine-tuning），RAG 只需更新知识库，成本更低、效率更高。

JustQ2026/2/17大约 2 分钟

向量概念

基础概念

在计算机科学和人工智能领域，向量（Vector） 是一个由数值组成的有序数组（例如 [0.1, 0.5, -0.3]）。

在自然语言处理（NLP）中，我们无法直接计算文本之间的“相似度”（比如“苹果”和“水果”在字面上完全不同）。为了解决这个问题，我们需要将文本（文字、句子、段落）转化为计算机能理解的数学形式，这就是向量。

嵌入 (Embedding)

将文本转换为向量的过程称为嵌入（Embedding）。

JustQ2026/2/16大约 2 分钟