因为最近在学关于网页的东西,所以便有了每看一个网页,总得先看看这个网页的源码的习惯. 突然我就想到了,起点中文网在看小说的界面是不允许复制粘贴,甚至连点右键都不会有反应, 那么如果我查看源码,能否复制小说呢? (下面这个页面是没法复制粘贴的,也不能点右键,下面这章小说是我为了实验,花一毛三分买的) 于是BUG来了,当我查看这个需要购买的小说章节的源码时,是能看见这章小说的,并且能够复制, 而我想讲的这就是一个安全漏洞,正常情况下,只有购买这章小说才能够阅读,现在,我只要购买一次, 然后复制粘贴之…
# 网络爬虫爬取起点中文网完本榜小说500部# 四步,分步操作,不易出错# 所需要获取的数据:书名 .作者.网址.类型.主要介绍.作品信息 from urllib.request import * #导入所有的request,urllib相当于一个文件夹,用到它里面的方法requestfrom lxml.etree import * #调用包import pickle #import timeimport pickle,fake_useragent# 第一步,将25页起点完本榜的每部小说的名字和…
爬虫简单之二---使用进程爬取起点中文网的六万多也页小说的名字,作者,等一些基本信息,并存入csv中 准备使用的环境和库Python3.6 + requests + bs4 + csv + multiprocessing 库的说明 requests模拟计算机对服务器发送requests请求 bs4:页面分析功能,分析页面找到所需要的特定内容 xlwt:把爬取的内容存入csv文件中 multiprocessing:开启多进程爬取 1.准备URLs 起点中文网 起点中文网的URL:https://w…
起点中文网,在“数字”上设置了文字反爬,使用了自定义的文字文件ttf通过浏览器的“检查”显示的是“□”,但是可以在网页源代码中找到映射后的数字正则爬的是网页源代码,xpath是默认utf-8解析网页数据,用xpath爬出来的也是方框,因此只能使用正则匹配爬取关键数字信息 本例以小说<斗罗大陆>为例 https://book.qidian.com/info/1115277,爬取阅读量等数字信息 爬取思路:1. 使用正则匹配爬取出网页源代码中的被设置反爬的数字信息(这里只能使用正则匹配)2. 寻找…
怎样才能提交一个让开发人员拍手叫好的bug单 软件测试人员写得最多的文档就是测试用例和BUG,现在测试用例和BUG都没有标准的模板,每个公司使用的缺陷管理工具都有可能不一样,如果你换了一家公司就有可能接触到新的缺陷管理工具,但提交bug的方式却是大同小异,今天这篇文章主要讲解怎样才能提交一个高质量的BUG单. 目录 为什么要提交BUG单 缺陷管理工具 编写高质量的BUG单 为什么要提交BUG单 其实要提交BUG单的原因很简单,就是在测试过程中程序中出错了,那么测试人员就要提交BUG单,以便开发人…
maven 引用另一个jar包 需要先打包在仓库里面 并在pom里面配置 才可以引用…
发现FIREDAC(DELPHI10 or 10.1)提交数据给ORACLE数据库的一个不是BUG的BUG,提交的表名大小写是敏感的. 只要有一个表名字母的大小写不匹配,ORACLE就会认为是一个不认识的表,提交的时候就会报错:表或视图不存在. 而有意思的是新增一行记录,提交的时候却不会报这个错误,只有修改数据再提交才会报这个错. MSSQL数据库则没有此问题. 请遇到同样问题的同仁注意这个问题.解决办法:表名大小写完全要匹配.…
今天,分享一个JDK中令人惊讶的BUG,这个BUG的神奇之处在于,复现它的用例太简单了,人肉眼就能回答的问题,JDK中却存在了十几年.经过测试,我们发现从JDK8到14都存在这个问题. 大家可以在自己的开发平台上试试这段代码: public class Hello {      public void test() {          int  i = 8;          while  ((i -= 3) > 0);          System.out.println("i = …
当前,绝大部分招聘都有性能要求或者把其作为加分项(会性能优先),哪怕你不是面试的性能,面试的时候可能会问性能,所以大家才会有"面试造火箭,进去拧螺丝"的共鸣.至于企业为什么重视性能,想必大家都知道,这里就不再赘述.性能分前端性能和服务端性能,需要的知识范畴也比较广,比如,后端性能需要的:linux.nginx.dubbo.mysql.redis.mq.jvm.java.jmeter或loadrunner等等主流的,后续也都将逐一分享这些知识.想必很多人的简历也都是匹配着招聘要求去写的吧…
bug Windows有一个bug,持续了十多年,从Windows Visita开始(2007年),一直存在,直到Windows11(2021年)才修复(其实也不叫修复,后面我再具体说),而Windows10还能重现这个bug,即便把系统更新到最新(2022年10月5日). 这个bug用语言来描述就是:使用Windows Explorer(资源管理器)的树形结构初次展开目录时,滚动条会发生不正确的滚动,使得展开的节点贴近了窗口底部的位置,而不是处于我们期待的顶部位置. 有些难懂?我录了一个视频来…