基础概念
在计算机科学和人工智能领域,向量(Vector) 是一个由数值组成的有序数组(例如 [0.1, 0.5, -0.3])。
在自然语言处理(NLP)中,我们无法直接计算文本之间的“相似度”(比如“苹果”和“水果”在字面上完全不同)。为了解决这个问题,我们需要将文本(文字、句子、段落)转化为计算机能理解的数学形式,这就是向量。
嵌入 (Embedding)
将文本转换为向量的过程称为嵌入(Embedding)。
2026/2/16大约 2 分钟
在计算机科学和人工智能领域,向量(Vector) 是一个由数值组成的有序数组(例如 [0.1, 0.5, -0.3])。
在自然语言处理(NLP)中,我们无法直接计算文本之间的“相似度”(比如“苹果”和“水果”在字面上完全不同)。为了解决这个问题,我们需要将文本(文字、句子、段落)转化为计算机能理解的数学形式,这就是向量。
将文本转换为向量的过程称为嵌入(Embedding)。