设想和目标 1. 我们的软件要解决什么问题?是否定义得很清楚?是否对典型用户和典型场景有清晰的描述?我们的主要任务是将35w+个符合条件的网页,问答,文章放入数据库:爬取功能定义为以下几种:通用型爬取,聚集型爬取,综合型爬取,问答页爬取,pdf爬取,doc爬取,ppt爬取:对于典型用户和典型场景有清晰的描述,这从我们爬取的类型分类就可以看出.2. 是否有充足的时间来做计划?大三上后期时间略有些紧,有编译和数据库大作业,还要准备期末考试,不过组员们还是抽出了不少时间来完成beta版本的各项任务.3…