一.全文索引的原理 数据存在形式: 1.结构化数据: 指具有固定格式或有限长度的数据,如数据库,元数据等. 2.非结构化数据(全文数据): 指不定长或无固定格式的数据,如邮件,word文档等. 3.半结构化数据:如XML,HTML等,当根据需要可按结构化数据来处理,也可抽取出纯文本按非结构化数据来处理. 数据形式不同搜索的形式也将不同: 1.对结构化数据的搜索 :如对数据库的搜索,用SQL语句.再如对元数据的搜索,如利用windows搜索对文件名,类型,修改时间进行搜索等. 2.对非结构化数据的