前言

文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:刘早起早起

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http://t.cn/A6Zvjdun

北京时间4月3日凌晨,全球新冠病毒感染人数突破100万,死亡人数超过5万。而这一切都在2020年刚开始的三个月内发生。可能你觉得这三个月很快,有些事情已经逐渐忘记,而互联网的记忆不会消失,数据也会说话。因此作者抓取了2020年1月1日至4月2日的每天微博排名前50条热搜共近5000条数据,通过分析微博热搜数据带你回顾这不平凡的90天。

Part1

首先我们制作这三个月全部热搜的词云图

可以看到,疫情下的微博热搜主要以疫情相关词汇组成,我们再根据每一条热搜的热度大小进行排序,得到这三个月中热度最高的十条热搜,猜猜是什么

令人惊讶的的是,在这三个月内的每日热度排名前十的热搜中娱乐相关的热搜为4条,疫情相关热搜为5条。并且第一第二的并不是疫情相关热搜,而是两位明星相关的资讯

Part2

我们接着提取中国各省市在热搜中出现的次数,以此来代表网友对各省的关注度绘制关注度地图与词云图

从热搜出现的省份来看最受关注的还是湖北省,其次是北京、上海、浙江、四川等省市,从热搜出现的城市来看,武汉、广州、北京、杭州、上海等城市出现次数较多。同时值得关注的是:境外和公主号邮轮也频上热搜。

Part3 疫情来袭

现在我们分析三个月内每天50条热搜中疫情相关热搜数量的变化,

不难看出,在1月19日之前,关于疫情相关的热搜基本保持在5条以下,甚至有几天并未出现相关热搜,但是自1月20日开始,突然暴增20+条,并且最高曾一天有30+条相关热搜,其中最主要集中在1月23至25日,我们再回顾那几天的热搜

可以看到,虽然正值新春佳节,但是全国网友的关注点基本都集中在疫情,在湖北,在武汉。而现在今天这条热搜已经有10亿+的阅读了。当然在这场疫情之下的热搜还有很多值得关注的热搜,比如河南硬核防疫频登热搜、买不到的口罩也曾霸屏微博、封闭式管理虽受吐槽但是颇有成效

Part4 逆行驰援

可能上面的热搜已经从记忆里淡去,但是你必须要记得的热搜应是全国各地医护人员驰援湖北,我们提取相关关键词的热搜并制作词云图

可以看到,从1月23日也就是我们刚刚分析的疫情热搜暴涨的那几天开始各地医生便逆行驰援武汉;2月1日,李兰娟带队驰援武汉;2月4日,再增加2000名医护人员支援湖北;2月7日,一省包一市支援湖北;2月13日,2月14日,四川、辽宁再派2批医疗队伍驰援湖北;2月20日,重庆调拨20万毫升血浆增援湖北⋯⋯

Part5 乌云散去

正是有着上面一群勇敢逆行的医护人员,加上大家的努力,疫情的乌云渐渐散去,因此三月的热搜主旋律除了防疫还有复工和开学

而说到开学,那就少不了小学生被钉钉支配的恐惧,我们提取相关热搜

再看看学生们的反馈

Part6

最后我们对近一周的热搜进行分析可以发现,疫情依旧是大家关注热点,但是侧重点已经从国内转向国外,并且无症状感染者已经引起了大家的关注,所以各位依旧要做好防护措施,不能对防疫掉以轻心!

以上就是对微博热搜数据的一些分析,不知是否唤醒了你的某些回忆,如果你也对该数据感兴趣希望挖掘更多的信息可以在后台回复微博获取。

注:本文所有分析使用的数据均采集于新浪微博公开数据 ,采样时间为每天23点。

2020不平凡的90天,Python分析三个月微博热搜数据带你回顾的更多相关文章

  1. Python爬取微博热搜以及链接

    基本操作,不再详述 直接贴源码(根据当前时间创建文件): import requests from bs4 import BeautifulSoup import time def input_to_ ...

  2. EDG夺冠!用Python分析22.3万条数据:粉丝都疯了!

    一.EDG夺冠信息 11月6日,在英雄联盟总决赛中,EDG战队以3:2战胜韩国队,获得2021年英雄联盟全球总决赛冠军,这个比赛在全网各大平台也是备受瞩目: 1.微博热搜第一名,截止2021-11-1 ...

  3. Python网络爬虫-爬取微博热搜

    微博热搜的爬取较为简单,我只是用了lxml和requests两个库 url=https://s.weibo.com/top/summary?Refer=top_hot&topnav=1& ...

  4. Python 数据分析实战 | 用数据带你回顾乔丹的职业生涯

    乔丹是联盟上下公认的历史第一人,芝加哥公牛在他带领下几乎统治了上世纪 90 年代 NBA 整整 10 年,包括分别在 91-93 赛季和 96-98 赛季拿下的两次三连冠,要知道,NBA72 年历史上 ...

  5. 用Python分析北京市蛋壳公寓租房数据

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理 近期,蛋壳公寓"爆雷"事件持续发酵,期间因拖欠房东房租与租客退款,蛋壳公寓陷入讨 ...

  6. 【可视化分析案例】用python分析B站Top100排行榜数据

    一.数据源 之前,我分享过一期爬虫,用python爬取Top100排行榜: 最终数据结果,是这样的: 在此数据基础上,做python可视化分析. 二.数据读取 首先,读取数据源: # 读取csv数据 ...

  7. python:王思聪究竟上了多少次热搜?

    前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 朱小五 凹凸玩数据 PS:如有需要Python学习资料的小伙伴可以加 ...

  8. 五月天的线上演唱会你看了吗?用Python分析网友对这场线上演唱会的看法

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:CDA数据分析师 豆瓣9.4分!这场线上演唱会到底多好看? 首先让我 ...

  9. Python爬虫+可视化教学:爬取分析宠物猫咪交易数据

    前言 各位,七夕快到了,想好要送什么礼物了吗? 昨天有朋友私信我,问我能用Python分析下网上小猫咪的数据,是想要送一只给女朋友,当做礼物. Python从零基础入门到实战系统教程.源码.视频 网上 ...

随机推荐

  1. Redis 主从复制技术原理

    基于前面介绍的 Redis 内容,Redis 只能作为一个单机内存数据库,一旦服务器宕机即不能提供服务,即便能通过持久化策略重启恢复数据,往往也做不到百分之百还原.再一个就是,单机的 Redis 需要 ...

  2. Leetcode_面试题62. 圆圈中最后剩下的数字(约瑟夫环)

    经典的约瑟夫环,n个人排成一圈,第m个出队. 递归 code1 class Solution { public: int f(int n,int m){ if(n==1){ //递归边界,最后一个 r ...

  3. 工作流--Activiti

    一.工作流 1.工作流介绍 工作流(Workflow),就是通过计算机对业务流程自动化执行管理.它主要解决的是“使在多个参与者  之间按照某种预定义的规则自动进行传递文档.信息或任务的过程,从而实现某 ...

  4. VMware使用总结

    1.处理器设置释疑 比如一个8核16线程处理器 处理器数量最多设置为8,而每个处理器的内核数量*处理器个数必须小于等于16. 2.虚拟网络编辑器 NAT模式中可通过NAT设置将内部端口映射到主机端口. ...

  5. matplotlib.pyplot.text

    matplotlib.pyplot.text(x, y, s, fontdict=None, withdash=<deprecated parameter>, **kwargs)[sour ...

  6. stm32CubeMx+TrueSTUDIO+uc/os-III移植开发(一)

    自从接触到stm32cubemx后,发现使用起来很方便,用来做项目开发的话,由于是图形化操作界面,工作效率比较快.如果要学习操作系统,以前的IDE如keil,IAR等IDE对操作系统的代码调试起来不够 ...

  7. TensorFlow系列专题(三):深度学习简介

    一.深度学习的发展历程 深度学习的起源阶段 深度学习的发展阶段 深度学习的爆发阶段 二.深度学习的应用 自然语言处理 语音识别与合成 图像领域 三.参考文献   一.深度学习的发展历程 作为机器学习最 ...

  8. Rasa Stack:创建支持上下文的人工智能助理和聊天机器人教程

    相关概念 Rasa Stack 是一组开放源码机器学习工具,供开发人员创建支持上下文的人工智能助理和聊天机器人: • Core = 聊天机器人框架包含基于机器学习的对话管理 • NLU = 用于自然语 ...

  9. Mayor's posters POJ - 2528 线段树(离散化处理大数?)

    题意:输入t组数据,输入n代表有n块广告牌,按照顺序贴上去,输入左边和右边到达的地方,问贴完以后还有多少块广告牌可以看到(因为有的被完全覆盖了). 思路:很明显就是线段树更改区间,不过这个区间的跨度有 ...

  10. FME中按照ID值过滤块参照中的多个要素