因为工作的原因,近段时间开始接触jsoup.大概也弄清了用java来爬网页是怎样一个过程.特此,写篇日志以便他日方便查看. Jsoup是一个java平台的能够对xml文档结构的文档进行解析.有点类似于dom4j吧.但是dom4j是利用流进行内容解析,遇到“<>”的标记进行节点与否的区分.而jsoup之前看了篇文章介绍,存储的方式更接近于java对象的方式.(我个人的看法吧,也不清楚是否准确,望指点!). 模拟登录的过程也是很简单的.只需要通过网页工具查看目标网站需要提交到的登录地址,再捕获下提…