llamaindex 有自己的Document对象。可以是一个PDF文件,MarkDown,txt等内容。 本质就是:一段完整原始文本 + metadata(元信息) 它还没有被切分,还没有向量,还没有索引。
Docuemnt