'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

问题描述：在使用python爬取斗鱼直播的数据时，使用str(读取到的字节，编码格式)进行解码时报错：'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

　　代码如下：

from urllib import request

class Spilder():

    url='https://www.douyu.com/'

    def __fetch_content(self):

        r = request.urlopen(Spilder.url)

        htmls = r.read()    #获取字节码（html）

        htmls = str(htmls, encoding='utf-8')

　　

    def go(self):

        self.__fetch_content()

spilder=Spilder()

spilder.go()

问题原因：断点调试的时候发现r.read()获取到的字节码是以‘b’\x1f\x8b\x08’开头的，说明它是gzip压缩过的数据，这也是报错的原因，所以我们需要对我们接收的字节码进行一个解码操作。修改之后的代码如下：

from urllib import request

from io import BytesIO

import gzip

class Spider():

    url = 'https://www.douyu.com/'

    def __fetch_content(self):

        r = request.urlopen(Spider.url)

        htmls = r.read()

        buff = BytesIO(htmls)

        f = gzip.GzipFile(fileobj=buff)

        htmls = f.read().decode('utf-8')

    # 入口方法

    def go(self):

        self.__fetch_content()

spider = Spider()

spider.go()

修改之后解码正常

'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte的更多相关文章

Python3 解决 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte
Python3 解决 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte 一.问题 request.Reque ...
Python3 使用requests请求，解码时出错：'utf8' codec can't decode byte 0x8b in position 1: invalid start byte
requests请求的响应内容能够通过几个属性获得: response.text 为解码之后的内容,解码会根据响应的HTTP Header中的Content-Type选择字符集.例如 "'C ...
解决 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte
"Accept-Encoding": "gzip, deflate", 这条信息代表本地可以接收压缩格式的数据,而服务器在处理时就将大文件压缩再发回客户端,IE ...
使用Python遇到：'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte 问题
查看你的HTTP头部是否有如下头部信息:"Accept-Encoding": "gzip, deflate" 这条信息代表本地可以接收压缩格式的数据,而服务器在 ...
【python】UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte
header中干掉 "Accept-Encoding": "gzip, deflate, br", 注意:
UnicodeDecodeError: 'utf8' codec can't decode byte 0xce in position 47: invalid continuation byte
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position 22: invalid continuation byte
在使用python读取文本文件,一般会这样写: # -*- coding:utf-8 -*- f = open("train.txt", "r", encodi ...
'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
'utf-8' codec can't decode byte 0xff in position 0: invalid start byte 觉得有用的话,欢迎一起讨论相互学习~Follow Me 今 ...
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position 52: invalid continuation byte
代码: df_w = pd.read_table( r'C:\Users\lab\Desktop\web_list_n.txt', sep=',', header=None) 当我用pandas的re ...

随机推荐

HTML的怎么使用，开发工具以及常用标签。
前端学习:学习地址:黑马程序员pink老师前端入门教程,零基础必看的h5(html5)+css3+移动,下面这些都是一些学习笔记.临渊羡鱼,不如退而结网!!愿我自己学有所成,也愿每个前端爱好者学有所成 ...
关于 vue2.x 的 $attrs 和 $listeners
$attrs $attrs 用于多层次组件传递参数(组件标签的attribute,class和style除外),爷爷辈组件向孙子辈组件传递参数(注:参数不能被父辈prop识别,一旦被父辈prop识别且 ...
SpringBoot 搭建基于 MinIO 的高性能存储服务
1.什么是MinIO MinIO是根据GNU Affero通用公共许可证v3.0发布的高性能对象存储.它与Amazon S3云存储服务兼容.使用MinIO构建用于机器学习,分析和应用程序数据工作负载的 ...
tp5.0使用JWT完成token认证技术
1.安装 composer require firebase/php-jwt 2.封装(在框架根目录extend下新建Token.php) 复制代码 <?php use Firebase\JWT ...
LGP3349口胡
建议改为:如何使用FWT直接把反演题草过去需要清楚 FWT 的本质是什么. 首先我们有一个明显的 DP: 设 $dp[u][x][S]$ 代表 $u$ 在图中为 $x$,子树包含集合 \ ...
Linux性能优化实战内存篇（五）
一.Linux内存工作原理 1,内存映射 Linux内核给每个进程都提供了一个独立的虚拟空间,并且这个地址空间是连续的.这样,进程就可以很方便地访问内存,更确切地说是访问虚拟内存. 虚拟地址空间的内部 ...
ArcMap线上均匀生成点
面中均匀生成点方法: [创建渔网]→[要素转点](或[要素折点转点])→[裁剪](或[按位置选择]→[导出数据]),即可. ArcMap中随机生成点: [随机生成点]工具最近博主的朋友有均匀布点的需 ...
面试突击32：为什么创建线程池一定要用ThreadPoolExecutor？
在 Java 语言中,并发编程都是依靠线程池完成的,而线程池的创建方式又有很多,但从大的分类来说,线程池的创建总共分为两大类:手动方式使用 ThreadPoolExecutor 创建线程池和使用 Ex ...
关于BFS
嗨,又是躺平的一天呢下文有很多未经版权允许而私自转载,不喜勿喷今天我来整理亿下关于 BFS 这个"高级"的东西: 首先,我不得不提亿句关于队列是个啥队列(queue)是一 ...
JavaWeb 03_创建servlet项目（详细）
一.创建web项目 1. File--New--Project 2. 设置项目相关信息 3. 设置项目名称及工作空间 4. web项目目录结构如下二.Servlet的实现 1. 新建包---类 ...

'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte的更多相关文章

随机推荐

热门专题