最近一直在研究爬虫的相关技术,网上关于爬虫的教程实在是太少了,只能靠一些零零散散的博客资料做一个浅度的学习,我们已经学习了webcollector,htmlparser,Jsoup这些爬虫技术,并也成功爬取了一些网站的数据,多多少少也算是有一些小的成就,今天又学习了一下crawlScript,这是一种专门用作爬虫的一个类似script语言的爬虫技术,而且代码精简,可以用最少的代码实现强大的功能.相关技术我们下次再做介绍.今天我们要做的就是把我们最近写的一些爬虫项目上传到GitHub上. GitH