我们生活中的数据总体分为两种:结构化数据 和 非结构化数据. 结构化数据:也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理.指具有固定格式或有限长度的数据,如数据库,元数据等. 非结构化数据:又可称为全文数据,不定长或无固定格式,不适于由数据库二维表来表现,包括所有格式的办公文档.XML.HTML.word文档,邮件,各类报表.图片和咅频.视频信息等. 说明:如果要更细致的区分的话,XML.HTML可划分为 半结构化数据.因为它…