Python在进行网页抓取时,有时会获取到经过gzip压缩后的数据(体积小,传输快),导致无法阅读和使用. 如图所示,为http原始报文.可以看到,header区域的“Content-Encoding: gzip”标明了正文是经过gzip压缩后的数据,而body区域蓝色框里面的数据即是gzip的数据源(至于body区域其它额外的字符,可能是一些辅助标记,这里不做关心). 至于为什么我们从浏览器打开网页时是可读的文字,是因为浏览器自动帮我们进行了解压. 那么,如何通过编程方式进行gzip解压呢?幸…