指用以描述一文件分类特徵的一维有序的集合。以索引词来描述文件分类特徵,在分类项目X1的文件含有索引词I1,I5和I7,分类项目X2的文件含有索引词I1, I3, I5和I6,则X1的向量为<1, 0, 0, 0, 1, 0, 1>,X2的向量为<1, 0, 1, 0, 1, 1, 0>。