关于Python,有一句名言:不要重复造轮子. 但是问题有三个: 1.你不知道已经有哪些轮子已经造好了,哪个适合你用.有名有姓的的著名轮子就400多个,更别说没名没姓自己在制造中的轮子. 2.确实没重复造轮子,但是在重复制造汽车.包括好多大神写的好几百行代码,为的是解决一个Excel本身就有的成熟功能. 3.很多人是用来抓图,数据,抓点图片.视频.天气预报自娱自乐一下,然后呢?抓到大数据以后做什么用呢?比如某某啤酒卖的快,然后呢?比如某某电影票房多,然后呢? 以下是经过Python3.6.4调试…
前言: 近几年Python可谓是大热啊,很多人都纷纷投入Python的学习中,以前我们实验楼总结过多篇Python实战项目列表,不但有用还有趣,最主要的是咱们实验楼不但有详细的开发教程,更有在线开发环境,非常适合Python学习者学习啊,今天再总结一批Python实战项目教程. 附上前面总结的Python项目教程列表: [给缺少Python项目实战经验的人] [(新)10个Python项目,给缺少Python项目实战经验的人] [这10个Python项目超有趣!] [Python实现从excel…
本次实战项目适合,有一定Python语法知识的小白学员.本人也是根据一些网上的资料,自己摸索编写的内容.有不明白的童鞋,欢迎提问. 目的:爬取百度小说吧中的原创小说<猎奇师>部分小说内容 链接:http://tieba.baidu.com/p/4792877734 首先,自己定义一个类,方便使用.其实类就像一个"水果篮",这个"水果篮"里有很多的"水果",也就是我们类里面定义的变量啊,函数啊等等,各种各样的.每一种"水果&q…
没有一个完整的项目开发过程,是不会对整个开发流程以及理论知识有牢固的认知的,对于怎样将所学的理论知识应用到实际开发中更是不得而知了! 以上就是我们在学习过程中必须要有项目实战开发经验的原因,其实无论项目大小,但是一定要动手去进行开发学习. 但是就有小伙伴说“哎呀,找不到好的项目开发教程啊:不知道可以开发什么呀……” 这篇文章呢,就是给那些找不到Python项目开发教程的人,以及不知道Python可以开发什么的人的,希望看完后,可以去实际动手操作学习,毕竟咱实验楼提供了在线的开发环境,可以随便使用…
设计到的前端知识 项目的前端页面使用vue来实现局部刷新,通过数据的双向绑定实现与用户的交互,下面来看一下需求,在用户输入内容后,前端需要做一些简单的规则校验,我们希望在在用户输入后能够实时检测,如果有错误能够在输入框的下方显示出来. <li> <label>用户名:</label> <input type="text" name="username" id="user_name"> <spa…
案例一: 重点: 1. 使用bs4 爬取 2. 数据写入本地 txt from bs4 import BeautifulSoup import requests url = "http://maoyan.com/board" header = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari…
利用selenium 模仿浏览器,登陆豆瓣 重点: 1. 要设置好 chromedriver配置与使用, chromedriver.exe 和 Chrome的浏览器版本要对应, http://chromedriver.storage.googleapis.com/index.html 2. Js代码写完可以在浏览器F12的控制台交互测试一下 from selenium import webdriver import time driver = webdriver.Chrome() driver.…
重点: 1. 用def函数 2. 使用 os.path.dirname("路径保存") , 实现每组图片保存在独立的文件夹中 方法1: import requests from lxml import etree import os import time start = time.time() def mz_spider(base_url, headers_one): res = requests.get(url=base_url, headers=headers_one) # 请求…
重点: 1.  指定路径创建文件夹,判断是否存在 2. 保存图片文件 # 获得校花网的地址,图片的链接 import re import requests import time import os start = time.time() num = 0 # 为了记录爬的照片的次数 # 设置路径 path = 'D:\校花网' # 判断目录下的文件夹是否已经创建,如果不存在 if not os.path.exists(path): # 则创建路径文件夹 os.makedirs(path) pri…
import pandas as pd import requests from bs4 import BeautifulSoup import time def spider(url, headers): print("正在抓取url: " + url) datas = requests.get(url=url, headers=headers).text # 解析url soup = BeautifulSoup(datas, 'lxml') # 获取数据集合,find_all 返回…