Daily Scrum 11.19 部分测试报告

下面是我们的部分测试报告：

功能测试部分：

1
Exception in thread "Thread-11" java.lang.IllegalArgumentException: Invalid uri 'http://tieba.baidu.com/home/main?un=?????1': Invalid query
at org.apache.commons.httpclient.HttpMethodBase.<init>(HttpMethodBase.java:222)
at org.apache.commons.httpclient.methods.GetMethod.<init>(GetMethod.java:89)
at DownLoadFile.run(DownLoadFile.java:59)
出现页面：贴吧404
2
Exception in thread "Thread-13" java.lang.IllegalArgumentException: Invalid uri 'http://tieba.baidu.com/f/index/forumpark?cn=??????&ci=0&pcn=???&pci=0&ct=1&rn=20&pn=1': Invalid query
at org.apache.commons.httpclient.HttpMethodBase.<init>(HttpMethodBase.java:222)
at org.apache.commons.httpclient.methods.GetMethod.<init>(GetMethod.java:89)
at DownLoadFile.run(DownLoadFile.java:59)
出现页面：？？？？？贴吧

上面几个都是因为url网址里面的字符无法识别导致的

3 测试了爬取若干页面所需时间：

网址：http://ask.csdn.net
爬取页面数：100
远航所有时间：22898（毫秒，下面的数字都用毫秒计算）
newbe所用时间：24318
cpu占有率：34.3%-44.7%
所占内存：161.6MB
爬取页面数：1000
远航所用时间：596204
newbe所用时间：855707
cpu占有率：29.6%-43.8%
所占内存：199.1-228.6MB
极限情况：
尝试爬取10000个页面，但是由于爬取速度随着爬取页面数的增加明显减慢，导致爬取过程缓慢，而且中途总是出现异常，最终最高达到4571个页面，时间：8378920（毫秒），花费了2小时以上，感觉这种极限极限测下去意义不是很大，所以就停止了。爬虫速度越爬越慢感觉非常明显，而且测试的时候偶然性很大，和电脑运行时的情况也有很大关系，而且本人测试的时候爬取失败率有点高，失败率达到了惊人的20-%-30%，感觉这方面是不是可以改进下，而且newbe爬虫速度也比远航的略慢。

下一步要开始测多个网址的情况和关键字搜索的情况。希望在下次测试结果之前能够把由于网页字符不能识别导致的bug解决掉。

UI测试：

1.对现有UI各个BUTTON的功能测试
所有按钮功能正常，没有问题。

2.对现有UI的布局的建议、改善方案与理由（尤其在细节方面）

a.首先是单词错误，how much pages 改为how many pages

b.how to use 按钮的位置不合理，目前是处于how much pages后面，逻辑性不强。改善建议是将其放在整个界面的顶部，并且将其长度拉长，使用户第一眼看到的的就是我们的how to use

c.or you can select the file按钮应放在第二模块的位置，即放在URL seed 下面，同时改名为or select the URL file(txt)。改动理由是这个模块与URL seed模块功能是一致的，同时其名字也应直接显示其功能

d.应统一所有按钮说明的单词写法，全部改为每个单词首字母大写。URL seed-> URL Seed,keyword->Keyword,how many pages->How Many Pages等

3.对使用说明文档的重新编写，要求文档简洁、清晰，方便用户

本爬虫软件是由newbe软件工程队在远航1617软件工程队的爬虫软件基础上进行改写开发而成的。
使用方法：
1.输入网址：在URL Seed中输入爬取的网址，可以输入多个网址（缺省为百度搜索）；或者选择yes按钮后用Select File按钮选择包含多个URL地址的txt文件
2.输入关键词：在Keyword中输入即可（缺省为通常爬取）
3.输入爬取数：在How Many Pages中输入即可（不可缺省）
4.选择页面保存地址：通过Save Path选项后的select即可，还可以通过open按钮打开目录
5.爬取：点击Start按钮；爬取开始后可以暂停Pause和继续Continue
6.分析：点击Analyze按钮
7.关闭：点击Close按钮
PS：
1.运行本爬虫软件需要连接指定服务器，服务器不是全天开启的，不连接服务器本软件无法正确运行。
2.本爬虫软件具有关键字搜索功能，并且可以展示爬取过程。
3.Keyword关键字搜索，可以通过输入关键字对爬取的网页进行过滤处理，只爬取带有关键字的网页（并进行排序，得到根据热度排列的相对最优结果）；
4.由于爬取速度有限，建议爬取网页的数量不要输入太多。
5.当爬取成功网页数达到How Many Pages中输入的网页数量时，爬取过程将会停止。
6.analyze中的饼状图是对服务器中存有的所有网页进行分类分析；条形图是本次爬取中根据热度排列的结果。

4.对已产生的图表的建议与测试
测试正常，全部实现了既定功能；显示清晰，标示了所有的情况。

下面是今天的燃尽图：

Daily Scrum 11.19 部分测试报告的更多相关文章

[ASE][Daily Scrum]11.19
Sprint2已经开始了~今天晚上有课所以今天的plan比较少~ View Shilin Liu 能够看见其他玩家发射出来的子弹能够看见其他玩家的子弹消失 Client Jiafan ...
Daily Scrum - 11/19
今天任烁帮忙更新了大家在Sprint 2中的Task,基本每人的Task都是细分到每天的,这样大家初期的工作应该会更有效率一点. 任烁今天表示“进度条背词法”应该是可以融合到原有算法中的,期待他的改进 ...
Daily Scrum 11.01
全队进展速度很快,11月伊始都完成了初步的工作.交由负责整合工作的毛宇开始调试整合. Member Today's task Tomorrow's task 李孟 task 616 测试 (活动) ...
Daily Scrum - 11/25
今天是Sprint 2的最后一天,我们在下午的课上对之前两个Sprint作了比较详尽的Review,并在课后Daily Scrum上讨论制订了Sprint 3的任务安排.具体Task会在明天更新在TF ...
Daily Scrum - 11/23
今天更新blog时发现了老师对我们daily scrum提的要求,从明天起除了简要记录组会的主要内容之外,还会总结上一个工作日每个组员的工作进度.代码提交情况和燃尽图. 今天会议内容主要是人千.章玮同 ...
Daily Scrum - 11/20
好习惯的养成需要两个星期. ——砖家今天我们小组又进行了一次愉快的例会,可以看到daily scrum在我们小组已经逐渐变成了每日的好习惯.首先对以下一些团队routine达成了共识: 1.spri ...
Sprint 1 Review & Daily Scrum - 11/18
今天我们组利用课后的时间对Sprint 1阶段进行了回顾,并对接下来的工作进行了安排. Sprint 1阶段我们开始定的计划是完成最基础的背单词功能,可以让用户可以完整地走一遍背单词流程.回顾上周,我 ...
Daily Scrum 11.2
由于11月1号是周六,小组里人不是很齐,所以Scrum会议暂停一次. 周日大家的工作都已经进入到尾声了,但是由于人员方面出现一些问题,界面方面做的还不到位.鉴于我们还只是完成了一个比较简单的工作,与真 ...
Daily Scrum 12.19
Member Task on 12.19 Task on 12.20 仇栋民请假完成Task972 : 完成活动评分基础功能康家华完成 Task1004 : 百度map UI优化完成Task ...

随机推荐

linux学习第十七天（NFS、AUTOFS文件共享配置，DNS配置）
一.NFS(网络文件系统,实现linux系统上文件共享) 服务器配置 yum install nfs-utils (安装NFS软件包) iptables -F (清空防火墙) service ip ...
jQuery----五星好评实现
在美团.淘宝.京东等网页上,有许多商品.服务评价页面,五星好评功能很常见,本文利用jQuery实现五星好评功能. 案例图片: ...
django中使用tinymce 富文本
django后台集成富文本编辑器Tinymce 安装方式一: 1.首先去python的模块包的网站下载一个django-tinymce的包 https://pypi.python.org/pypi/ ...
复制文件到IDE等工具出现乱码解决方案
首要的解决方案是设置文件或者项目或者工作空间的编码,可以采用在文件上.项目上右键->properties进行设置第二种方式是在editplus等编辑器里打开文件,然后打开文件之后点击菜单Fil ...
20145207 Exp9 web安全基础实践
Exp9 web安全基础实践实验后回答问题 (1)SQL注入攻击原理,如何防御攻击原理:修改信息防御:禁止输入 (2)XSS攻击的原理,如何防御攻击原理:看别人的博客,感觉就是强制访问. 防御 ...
【转载】MSXML应用总结概念篇
原文:http://blog.sina.com.cn/s/blog_48f93b530100e9tr.html 微软提供了大量的XML开发工具和技术,而SMXML(Microsoft XML Core ...
23-[jQuery]-效果：隐藏，淡出，盒子高度，动画
1.隐藏,显示 <!DOCTYPE html> <html lang="en"> <head> <meta charset="U ...
MySQL数据库查询某个库下有几张数据表
如果统计某数据库中存在多少张数据表,使用如下SQL检索语句即可: SELECT COUNT(*) TABLES, table_schema FROM information_schema.TABLES ...
Oracle中Date和Timestamp的区别
Date和Timestamp精度不一样: 01)Timestamp精确到了秒的小数点(如:2018-11-13 16:40:03.698): 02)Date只精确到整数的秒(如:2018-11-13 ...
arduino八段数码管使用
一:八段数码管的使用控制要求:0-9的计时数据实物连接图: 控制代码: //智慧自动化2018.6.11 ;//定义数字接口7 连接a 段数码管 ;// 定义数字接口6 连接b 段数码管 ;// ...

Daily Scrum 11.19 部分测试报告

Daily Scrum 11.19 部分测试报告的更多相关文章

随机推荐

热门专题