go 虎牙爬取

package main

import (

	"fmt"

	"github.com/antchfx/htmlquery"

	"io/ioutil"

	"net/http"

)

func main() {

	var url string = "https://www.huya.com/l"

	resp, _ := http.Get(url)

	defer resp.Body.Close()

	doc,_ := htmlquery.Parse(resp.Body)

	list := htmlquery.Find(doc, "//ul[@id='js-live-list']//li")

	for _,li := range list{

		nick := htmlquery.FindOne(li,"//i[@class='nick']/text()")

		//people := htmlquery.FindOne(li,"//i[@class='js-num']/text()")

		//title := htmlquery.FindOne(li,"//a[@class='title']")

		img := htmlquery.FindOne(li,"//a[@class='video-info ']/img/@data-original")

		//fmt.Printf("%s %s %s %s\n",htmlquery.InnerText(nick),htmlquery.InnerText(people),htmlquery.SelectAttr(title,"title"),htmlquery.SelectAttr(img,"data-original"))

		imgurl := htmlquery.SelectAttr(img,"data-original")

		titleString := htmlquery.InnerText(nick)

		savepic(imgurl,titleString)

	}

}

func savepic(url string,name string ) {

	if len(url)<= 0{

		return

	}

	if url[0:2] == "//" {

		url =   "http:"+url

	}

	resp, err := http.Get(url)

	if err !=nil{

		fmt.Println("http error",err)

		return

	}

	content, err1 := ioutil.ReadAll(resp.Body)

	if err1 != nil{

		fmt.Println("read err",err1)

		return

	}

	file := ioutil.WriteFile("./imgs/"+name+".jpg", content, 0777)

	if file != nil {

		fmt.Printf("下载图片%s 失败\n", name)

	} else{

		fmt.Printf("下载图片%s 成功\n", name)

	}

}

go 虎牙爬取的更多相关文章

Scrapy:虎牙爬取，图片存储与数据分析
第一次爬取虎牙主播数据,有点小激动 1.共批量爬取的101个主播的,包括头像主播名字房间号房间链接 2.数据规整部分,需要将json数据加载到pandas的Dataframe,只显示的前15个 ...
Scrapy框架爬虫初探——中关村在线手机参数数据爬取
关于Scrapy如何安装部署的文章已经相当多了,但是网上实战的例子还不是很多,近来正好在学习该爬虫框架,就简单写了个Spider Demo来实践.作为硬件数码控,我选择了经常光顾的中关村在线的手机页面 ...
python爬取github数据
爬虫流程在上周写完用scrapy爬去知乎用户信息的爬虫之后,github上star个数一下就在公司小组内部排的上名次了,我还信誓旦旦的跟上级吹牛皮说如果再写一个,都不好意思和你再提star了,怕你们 ...
Python多线程爬虫爬取电影天堂资源
最近花些时间学习了一下Python,并写了一个多线程的爬虫程序来获取电影天堂上资源的迅雷下载地址,代码已经上传到GitHub上了,需要的同学可以自行下载.刚开始学习python希望可以获得宝贵的意见. ...
python3爬取1024图片
这两年python特别火,火到博客园现在也是隔三差五的出现一些python的文章.各种开源软件.各种爬虫算法纷纷开路,作为互联网行业的IT狗自然看的我也是心痒痒,于是趁着这个雾霾横行的周末瞅了两眼,作 ...
从爬取湖北某高校hub教务系统课表浅谈Java信息抓取的实现 —— import java.*;
原创文章与源码,如果转载请注明来源. 开发环境:Myeclipse,依赖包:apache-httpclient . Jsoup.base64 一.概述整个系统用Java开发.我们现在要做的是类似于超 ...
使用beautifulsoup与requests爬取数据
1.安装需要的库 bs4 beautifulSoup requests lxml如果使用mongodb存取数据,安装一下pymongo插件 2.常见问题 1> lxml安装问题如果遇到lxm ...
python爬虫学习(7) —— 爬取你的AC代码
上一篇文章中,我们介绍了python爬虫利器--requests,并且拿HDU做了小测试. 这篇文章,我们来爬取一下自己AC的代码. 1 确定ac代码对应的页面如下图所示,我们一般情况可以通过该顺序 ...
Python实战项目网络爬虫之爬取小说吧小说正文
本次实战项目适合,有一定Python语法知识的小白学员.本人也是根据一些网上的资料,自己摸索编写的内容.有不明白的童鞋,欢迎提问. 目的:爬取百度小说吧中的原创小说<猎奇师>部分小说内容 ...

随机推荐

switch-case 选择语句
0. 语句模型 Go 里的选择语句模型是这样的 switch 表达式 { case 表达式1: 代码块 case 表达式2: 代码块 case 表达式3: 代码块 case 表达式4: 代码块 cas ...
Android如何使用注解进行代码检查
原文首发于微信公众号:躬行之(jzman-blog),欢迎关注交流! Android Studio 内置了代码检查工具 Lint,可在菜单栏选择 Analyze > Inspect Code 执 ...
（转载）IO模型
本文转载自网络. 如有侵权,请联系处理! 简介参考<UNIX Network Programming Volume 1, ThirdEdition [Electronic resources] ...
第二次UML作业
博客班级 https://edu.cnblogs.com/campus/fzzcxy/2018SE1/ 作业要求 https://edu.cnblogs.com/campus/fzzcxy/2018S ...
Centos6.6x系统与unbutu18.04系统升级ssh到8.3版本
Centos6.6升级ssh5.3版本到ssh8.3版本下载所需要的源码包: ]#wget https://files-cdn.cnblogs.com/files/luckjinyan/zlib-1 ...
Java知识系统回顾整理01基础06数组05复制数组
数组的长度是不可变的,一旦分配好空间,是多长,就多长,不能增加也不能减少一.复制数组把一个数组的值,复制到另一个数组中 System.arraycopy(src, srcPos, dest, de ...
Unicode和多字节字符集
今天自己写的发现一个输出路径程序使用unicode字符集只能输出单个的首字符,问了一下同事,改为使用多字节字符集,问题解决了于是上网看了他们的区别: 很多没看完,但起码了解到字符集的演变过程, 转 ...
matlab中colormap
来源:https://ww2.mathworks.cn/help/matlab/ref/colormap.html?searchHighlight=colormap&s_tid=doc_src ...
C/C++ 中 exit() 函数
参考: https://blog.csdn.net/jjjcainiao/article/details/21935795 知乎上的问题]C/C++ 中 exit() 函数的参数到底有什么意义? C ...
【题解】CF413C Jeopardy!
\(\color{blue}{Link}\) \(\text{Solution:}\) 首先,显然的策略是把一定不能翻倍的先加进来.继续考虑下一步操作. 考虑\(x,y\)两个可以翻倍的物品,且\(a ...

go 虎牙爬取

go 虎牙爬取的更多相关文章

随机推荐

热门专题