InlineShape表示的类型其实不只是图片,还包括OLE, ACTIVE X等. 下面是MSDN中的定义:Represents an object in the text layer of a document(表示文档中文本层的一个对象). 可以通过InlineShape的Type属性获得这个对象的具体类型.Type是一个WdInlineShapeType的枚举类型.WdInlineShapeType可以说下面的常数之一: wdInlineShapeEmbeddedOLEObject 嵌…
Extractor的工作是从下载的网页中将它包含的所有URL提取出来.这是个细致的工作,你需要考虑到所有可能的url的样式,比如网页中常常会包含相对路径的url,提取的时候需要将它转换成绝对路径.这里我们选择使用正则表达式来完成链接的提取. html标签中的链接地址通常会出现在href属性或者src属性中,所以我们采用两个正则表达式来匹配网页中的所有链接地址. 网页链接提取器Extractor类: using System; using System.Colle…