Python一日一练05----怒刷点击量

功能

自己主动获取CSDN文章列表，并对每篇文章添加点击量.

源代码

import urllib.request

import re

import time

import random

from bs4 import BeautifulSoup

p = re.compile('/a359680405/article/details/........')

#自己的博客主页

url = "http://blog.csdn.net/a359680405"

#使用build_opener()是为了让python程序模仿浏览器进行訪问

opener = urllib.request.build_opener()

opener.addheaders = [('User-agent', 'Mozilla/5.0')]

html = opener.open(url).read().decode('utf-8')

allfinds = p.findall(html)

print(allfinds)

urlBase = "http://blog.csdn.net"#须要将网址合并的部分

#页面中的网址有反复的，须要使用set进行去反复

mypages = list(set(allfinds))

for i in range(len(mypages)):

    mypages[i] = urlBase+mypages[i]

print('要刷的网页有：')

for index , page in enumerate(mypages) :

    print(str(index), page)

#设置每一个网页要刷的次数

brushMax = 200

#全部的页面都刷

print('以下開始刷了哦：')

for index , page in enumerate(mypages) :

    brushNum=random.randint(0,brushMax)

    for j in range(brushNum):

        try :

            pageContent = opener.open(page).read().decode('utf-8')

            #使用BeautifulSoup解析每篇博客的标题

            soup = BeautifulSoup(pageContent)

            blogTitle = str(soup.title.string)

            blogTitle = blogTitle[0:blogTitle.find('-')]

            print(str(j) , blogTitle) 

        except urllib.error.HTTPError:

            print('urllib.error.HTTPError')

            time.sleep(1)#出现错误。停几秒先

        except urllib.error.URLError:

            print('urllib.error.URLError')

            time.sleep(1)#出现错误，停几秒先

        time.sleep(0.1)#正常停顿，以免server拒绝訪问

Python一日一练05----怒刷点击量的更多相关文章

selenium+chromedriver刷点击量
#coding=utf-8 import re import time import json import requests from selenium import webdriver from ...
python通过代理刷网页点击量
python通过代理刷网页点击量更新异常处理情况 @time 2013-0803 更新循环里计数问题和随机等待时间问题 #!/usr/bin/python #-*- coding:utf-8 -*- ...
Python全栈day 05
Python全栈day 05 一.数据类型补充 1. int py2和py3的2种区别 py2有int和long,int的取值范围为-2^31~2^31-1,超出范围自动转为long,长整型. py2 ...
Halcon一日一练：读取文件目录图像的三种方法
第一种方法: 读了一个单一图像: read_image(Image,'fabrik') 这种方式可以快速的读取软件自身携带的库图像文件,系统设定了库图像映像文件的快速读取方式,我们也可以通过绝对地址的 ...
python每日一练：0007题
第 0007 题: 有个目录,里面是你自己写过的程序,统计一下你写过多少行代码.包括空行和注释,但是要分别列出来. # -*- coding:utf-8 -*- import os def count ...
[python每日一练]--0012:敏感词过滤 type2
题目链接:https://github.com/Show-Me-the-Code/show-me-the-code代码github链接:https://github.com/wjsaya/python ...
Python 每日一练 | Flask 实现半成品留言板
留言板Flask实现引言看了几天网上的代码,终于写出来一个半成品的Flask的留言板项目,为什么说是半成品呢?因为没能实现留言板那种及时评论刷新的效果,可能还是在重定向上有问题或者渲染写的存在问 ...
Python 每日一练(5)
引言 Python每日一练又开始啦,今天的专题和Excel有关,主要是实现将txt文本中数据写入到Excel中,说来也巧,今天刚好学校要更新各团支部的人员信息,就借此直接把事情做了主要对于三种数据类 ...
Python 每日一练（4）
引言今天继续是python每日一练的几个专题,主要涵盖简单的敏感词识别以及图片爬虫敏感词识别这个敏感词的识别写的感觉比较简单,总的概括之后感觉功能可以简略成if filter_words in ...

随机推荐

动态从数据库读取菜单（ASP.NET版）
这几天一直打算做个从数据读取导航菜单的效果,以前做的时候都是写死的(太死了),好了话不多说,先看效果! 我是个小菜,高手请不要喷!我在网上查了好久,说用menu控件,但是我用了不太好!最后我决定用re ...
DevExpress GridView.CustomSummaryCalculate 实现自定义Group Summary
--首发于博客园, 转载请保留链接博客原文 DevExpress Documentation官方地址:GridView.CustomSummaryCalculate Event 1. 概要界面上 ...
static——第一次执行与它以后执行时结果不一样
void generate_initializer(char* string); int _tmain(int argc, _TCHAR* argv[]) { "}; ; i < ; ...
Java基础知识强化40：StringBuffer类之StringBuffer的替换功能
1. StringBuffer的替换功能: public StringBuffer replace(int start, int end, String str): 2. 案例演示: p ...
重学《C#高级编程》（泛型与数组）
前段时间工作比较忙,就没有写随笔了,现在继续. 前两天重新看了泛型和数组两章,简单说下我自己的收获吧泛型我们知道数组是一种批量的数据格式,而泛型其实就是一种自定义的批量数据格式,当数组和C#现有的 ...
AngularJs练习Demo15自定义服务
@{ Layout = null; } <!DOCTYPE html> <html> <head> <meta name="viewport&quo ...
MS SQL到Oracle的数据迁移笔记
MS SQL到Oracle的数据迁移笔记一.任务背景旧系统使用MS SQL Server数据库,新系统使用Oracle数据库,现在需要将旧系统中的数据迁移到新系统中,旧数据按照约定的规则转换后,能 ...
创建自托管的SignalR服务端
微软官方例子地址:http://www.asp.net/signalr/overview/deployment/tutorial-signalr-self-host 1.说明: SignalR服务端可 ...
How can I save HICON to an .ico file
refer:http://stackoverflow.com/questions/2289894/how-can-i-save-hicon-to-an-ico-file answer1: #inclu ...
C# 汉子增加UTF-8头
using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace Conv ...

Python一日一练05----怒刷点击量

功能

源代码

Python一日一练05----怒刷点击量的更多相关文章

随机推荐

热门专题