爬取腾讯课堂IT-互联网分类的的课程信息存入csv文件

标签（空格分隔）： python

from urllib.request import urlopen

from bs4 import BeautifulSoup

#获取IT-互联网分类每页的课程的链接

for i in range(1,35):

    url = 'https://ke.qq.com/course/list?mt=1001&page='+str(i)

    html = urlopen(url)

    bs_obj = BeautifulSoup(html,'html.parser')

    bs_obj = bs_obj.find('ul',{'class':'course-card-list'})

    links = bs_obj.find_all('a',{'class':'item-tt-link'})

    #准备一个文件，先将标题写入的文件中

    with open('./tengxu.csv','w',encoding='utf8') as f:

        f.write('课程名称,链接地址,购买人数,好评度,价格\n')

    #获取每个课程的名称、链接、报名人数、好评度、价格

    for link in links:

        course_name = link.get_text()

        course_link = 'https:' + link.attrs.get('href')

        course_html = urlopen(course_link)

        bs_objec = BeautifulSoup(course_html,'html.parser')

        number_buyer_bs = bs_objec.find('span',{'class':'apply-num js-apply-num'})

        number_buyer = number_buyer_bs.get_text()

        good_evaluate_bs = bs_objec.find('span',{'class','rate-num'})

        good_evaluate = good_evaluate_bs.get_text()

        price_bs = bs_objec.find('span',{'class':'price'})

        price = price_bs.get_text()

        #将信息写入到文件中

        with open('./tengxu.csv','a',encoding='utf8') as f:

            f.write(course_name)

            f.write(',')

            f.write(course_link)

            f.write(',')

            f.write(number_buyer)

            f.write(',')

            f.write(good_evaluate)

            f.write(',')

            f.write(price)

            f.write('\n')

爬取腾讯课堂IT-互联网分类的的课程信息存入csv文件的更多相关文章

教你爬取腾讯课堂、网易云课堂、mooc等所有课程信息
本文的所有代码都在GitHub上托管,想要代码的同学请点击这里
简单的scrapy实战:爬取腾讯招聘北京地区的相关招聘信息
简单的scrapy实战:爬取腾讯招聘北京地区的相关招聘信息简单的scrapy实战:爬取腾讯招聘北京地区的相关招聘信息系统环境:Fedora22(昨天已安装scrapy环境) 爬取的开始URL:ht ...
Python爬取腾讯新闻首页所有新闻及评论
前言这篇博客写的是实现的一个爬取腾讯新闻首页所有的新闻及其所有评论的爬虫.选用Python的Scrapy框架.这篇文章主要讨论使用Chrome浏览器的开发者工具获取新闻及评论的来源地址. Chrom ...
【转】爬取豆瓣电影top250提取电影分类进行数据分析
一.爬取网页,获取需要内容我们今天要爬取的是豆瓣电影top250页面如下所示: 我们需要的是里面的电影分类,通过查看源代码观察可以分析出我们需要的东西.直接进入主题吧! 知道我们需要的内容在哪里了, ...
Python爬虫实战：爬取腾讯视频的评论
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 易某某 PS:如有需要Python学习资料的小伙伴可以加点击下方链 ...
（java）selenium webdriver爬虫学习--爬取阿里指数网站的每个分类的top50 相关数据；
主题:java 爬虫--爬取'阿里指数'网站的每个分类的top50 相关数据: 网站网址为:http://index.1688.com/alizs/top.htm?curType=offer& ...
使用Scrapy框架爬取腾讯新闻
昨晚没事写的爬取腾讯新闻代码,在此贴出,可以参考完善. # -*- coding: utf-8 -*- import json from scrapy import Spider from scrap ...
python 爬取腾讯视频的全部评论
一.网址分析查阅了网上的大部分资料,大概都是通过抓包获取.但是抓包有点麻烦,尝试了F12,也可以获取到评论.以电视剧<在一起>为例子.评论最底端有个查看更多评论猜测过去应该是 Ajax ...
python 爬取腾讯微博并生成词云
本文以延参法师的腾讯微博为例进行爬取并分析 ,话不多说直接附上源代码.其中有比较详细的注释. 需要用到的包有 BeautifulSoup WordCloud jieba # coding:utf-8 ...

随机推荐

Angular5学习笔记 - 创建组件（四）
一.创建组件 ng generate component component-name #简写 ng g c component-name ng generate directive|pipe|ser ...
showModalDialog()子窗口刷新父窗口
今天再次使用showModalDialog(),发现了两个问题,一是子窗口如何刷新父窗口,二是窗口的参数问题. 1 子窗口刷新父窗口如果是window.open();问题就好办,直接用window. ...
Celery-4.1 用户指南: Signals (信号)
基础有多种类型的事件可以触发信号,你可以连接到这些信号,使得在他们触发的时候执行操作. 连接到 after_task_publish 信号的示例: from celery.signals impor ...
第三章 Java内存模型（下）
锁的内存语义中所周知,锁可以让临界区互斥执行.这里将介绍锁的另一个同样重要但常常被忽视的功能:锁的内存语义锁的释放-获取建立的happens-before关系锁是Java并发编程中最重要的同步机 ...
关于:cross_validation.scores
# -*- coding: utf-8 -*- """ Created on Wed Aug 10 08:10:35 2016 @author: Administrato ...
问题：oracle LISTAGG 连接字符串；结果：Oracle 连接字符串的方法
Oracle 连接字符串的方法方法一:wmsys.wm_concat(column) 介绍:其函数在Oracle 10g推出,在10g版本中,返回字符串类型,在11g版本中返回clob类型.括号里面 ...
C++知识点总结(四)——面向对象的编程细节总结
1.空类的默认函数一般情况下,对于任意一个类A,如果程序员不显示的声明和定义上述函数,C++编译器将会自动的为A产生4个public inline(公有.内联)的默认函数,这4个函数最常见的形式为: ...
viewpagerindicator+UnderlinePageIndicator+ viewpage切换
布局文件activity_main.xml <LinearLayout xmlns:android="http://schemas.android.com/apk/res/androi ...
02 mybatis环境搭建【spring + mybatis】
1 导包 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.o ...
c语言实战：计算时间差
计算时间差有两种,一种是把时间都转化为分钟数,一种是把时间都转化为小时,后者是会用到除法所以不可避免产生浮点数,所以我们选择转化为分钟数来计算. //题目:给定两个时间点计算它们的时间差,比如,1:5 ...

爬取腾讯课堂IT-互联网分类的的课程信息存入csv文件

爬取腾讯课堂IT-互联网分类的的课程信息存入csv文件的更多相关文章

随机推荐

热门专题