爬取指定网页的源代码显示在GUI中

建立一个GUI图形界面用来用来输入网址和代码显示的区域

 #encoding=utf-8

 __author__ = 'heng'

 #创建一个可以抓取输入网址源代码的GUI

 from urllib2 import urlopen

 import wx

 #建立爬取网页的函数

 def capture(event):

     webpage = urlopen(the_URL.GetValue())

     contents.SetValue(webpage.read())

     webpage.close()

 #首先建立图形界面

 app = wx.App()

 win = wx.Frame(None,title = "The Editor ",size = (500,500))

 bkg = wx.Panel(win)

 searchButton = wx.Button(bkg,label = "Search")   #设置搜索按键

 #开始调用搜索函数

 searchButton.Bind(wx.EVT_BUTTON,capture)

 the_URL = wx.TextCtrl(bkg)                        #创建URL的文本输入框

 contents = wx.TextCtrl(bkg,style = wx.TE_MULTILINE | wx.HSCROLL)

 hbox = wx.BoxSizer()

 hbox.Add(the_URL,proportion = 1,flag = wx.EXPAND)

 hbox.Add(searchButton,proportion = 0,flag = wx.LEFT,border = 5)

 bbox = wx.BoxSizer(wx.VERTICAL)

 bbox.Add(hbox,proportion = 0,flag = wx.EXPAND | wx.ALL,border = 5)

 bbox.Add(contents,proportion = 1,flag = wx.EXPAND| wx.LEFT|wx.RIGHT|wx.BOTTOM,border = 5)

 bkg.SetSizer(bbox)

 win.Show()

 app.MainLoop()

运行效果图

输入要爬取的网页之后点击search就可以开始爬取指定的网页。

爬取指定网页的源代码显示在GUI中的更多相关文章

Python-定时爬取指定城市天气(二)-邮件提醒
目录一.概述二.模块重新划分三.优化定时任务四.发送邮件五.源代码一.概述上一篇文章python-定时爬取指定城市天气(一)-发送给关心的微信好友中我们讲述了怎么定时爬取城市天气,并发送 ...
Python-定时爬取指定城市天气(一)-发送给关心的微信好友
一.背景上班的日子总是3点一线,家里,公司和上班的路径,对于一个特别懒得我来说,经常遇到上班路上下雨了,而我却没带伞,多么痛的领悟.最近对python有一种狂热的学习热情,写了4年多的C++代码,对 ...
Python：将爬取的网页数据写入Excel文件中
Python:将爬取的网页数据写入Excel文件中通过网络爬虫爬取信息后,我们一般是将内容存入txt文件或者数据库中,也可以写入Excel文件中,这里介绍关于使用Excel文件保存爬取到的网页数据的 ...
利用爬虫爬取指定用户的CSDN博客文章转为md格式，目的是完成博客迁移博文到Hexo等静态博客
文章目录功能爬取的方式: 设置生成的md文件命名规则: 设置md文件的头部信息是否显示csdn中的锚点"文章目录"字样,以及下面具体的锚点默认false(因为csdn中是集 ...
python爬取某个网页的图片-如百度贴吧
python爬取某个网页的图片-如百度贴吧作者:vpoet mail:vpoet_sir@163.com 注:随意copy,不用告诉我 #coding:utf-8 import urllib imp ...
使用htmlparse爬虫技术爬取电影网页的全部下载链接
昨天,我们利用webcollector爬虫技术爬取了网易云音乐17万多首歌曲,而且还包括付费的在内,如果时间允许的话,可以获取更多的音乐下来,当然,也有小伙伴留言说这样会降低国人的知识产权保护意识,诚 ...
python使用requests库爬取网页的小实例：爬取京东网页
爬取京东网页的全代码: #爬取京东页面的全代码 import requests url="https://item.jd.com/2967929.html" try: r=requ ...
使用htmlparser爬虫技术爬取电影网页的全部下载链接
昨天,我们利用webcollector爬虫技术爬取了网易云音乐17万多首歌曲,而且还包括付费的在内,如果时间允许的话,可以获取更多的音乐下来,当然,也有小伙伴留言说这样会降低国人的知识产权保护意识,诚 ...
Python 爬取单个网页所需要加载的地址和CSS、JS文件地址
Python 爬取单个网页所需要加载的URL地址和CSS.JS文件地址通过学习Python爬虫,知道根据正式表达式匹配查找到所需要的内容(标题.图片.文章等等).而我从测试的角度去使用Python爬 ...

随机推荐

Hadoop-01 搭建hadoop伪分布式运行环境
Linux中配置Hadoop运行环境程序清单 VMware Workstation 11.0.0 build-2305329 centos6.5 64bit jdk-7u80-linux-x64.r ...
luogu 1113 杂务--啥？最长路？抱歉，我不会
P1113 杂务题目描述 John的农场在给奶牛挤奶前有很多杂务要完成,每一项杂务都需要一定的时间来完成它.比如:他们要将奶牛集合起来,将他们赶进牛棚,为奶牛清洗乳房以及一些其它工作.尽早将所有杂务 ...
CF993E Nikita and Order Statistics 多项式卷积快速傅里叶变换
题意: 给你一个数组a1~an,对于k=0~n,求出有多少个数组上的区间满足:区间内恰好有k个数比x小.x为一个给定的数.n<=10^5.值域没有意义. 分析: 大神们都说这道题是一个套路题,真 ...
virsh 命令
virsh是用与管理虚拟化环境中的客户机和Hypervisor的命令行工具,与virt-manager等工具类似,也是调用libvirt API来实现虚拟化的管理. 在使用virsh命令行进行虚拟化管 ...
Python 函数的初识
1.函数的初识函数的作用:以功能为导向减少代码重复 # 函数试编程 # 函数以功能(完成一件事)为导向,登录注册, # 一个函数就是一个功能,一个函数只能写一个功能 # 何时需要何时调用,随调 ...
solr中的schema.xml(managed-schema)文件解读
solr 7.2.1版本managed-schema文件示例 <uniqueKey>id</uniqueKey> 唯一键字段,solr对每一个文档都赋予一个唯一标识符字段,避免 ...
STL中set求交集、并集、差集的方法
并集(http://zh.cppreference.com/w/cpp/algorithm/set_union) 交集(http://zh.cppreference.com/w/cpp/algorit ...
计蒜客 Overlapping Rectangles （离散化）
题意: 给定一个坐标系, 给出n个矩形的左下角坐标(bx,by)和右上角坐标(tx,ty) , 求矩形覆盖的面积, 有些区域会被多个矩形覆盖, 但只用算一次. n <= 1000, 0 < ...
robotframework使用requestsLibrary进行接口测试
一.定义接口测试:接口测试通常是系统之间交互的接口,或者某个系统对外提供的一些接口服务分类:RESTful.webservice接口二.安装进入C:\Pyhon27\scripts 先要安装r ...
_063_Android_Android内存泄露
深入内存泄露 Android应用的内存泄露,其实就是java虚拟机的堆内存泄漏. 当然,当应用有ndk,jni时,没有及时free,本地堆也会出现内存泄漏. 本文只是针对JVM内存泄漏应用,进行阐述分 ...

爬取指定网页的源代码显示在GUI中

爬取指定网页的源代码显示在GUI中的更多相关文章

随机推荐

热门专题