python requests抓取NBA球员数据,pandas进行数据分析,echarts进行可视化 (前言)

  感觉要总结总结了,希望这次能写个系列文章分享分享心得,和大神们交流交流,提升提升。
  因为半桶子水的水平,一直在想写什么为什么写怎么写
  直到现在找到了一种好的办法:
    1.写什么 自己手上掌握的,工作中经常用到的,从数据源 到 最后可视化 所有一套流程。
    2.为什么写 因为很长一段时间没有进行总结和梳理了,总感觉很多东西很零散,另一方面,写写笔记也是对那些东西的一次巩固。
    3.怎么写 这个问题其实想了很久,后来想通了,就是怎么把工具都放在手上,结合着用起来,按流程走。
 
  接下来都会这么写:
    1.梳理思路
    2.找数据
    3.连数据
    4.pandas xjb一顿操作
    5.可视化
    6.总结
 
找数据:
  理由一:本人没事喜欢打打篮球,也喜欢看NBA,作为虎扑老JR,本次xjb操作,就在虎扑抓一些数据好了。
  理由二:经常逛虎扑的人都看得出来,虎扑的工作人员对于NBA球员的数据这几年完善的非常到位,各类数据都有,而且比赛及球员数据确实是练手的好数据。
  备注:仅是部分样本数据,目的只有一个:练手。
  可以这么理解:如果你想练刀工,重点不在于你是切鸡肉还是鸭肉,在于你手上的刀玩得溜不溜,不管是鸡肉,鸭肉还是鹅肉,切好他们的同时让你刀工更加进步。
 
连数据:
  我用的是 python + pymysql 方式,还有用pandas读取excel,csv,txt文件都是ok的。
  python连接数据库有很多人用的是MySQL-python,mysqlclient,peewee或者SQLAlchemy库,也是ok的。
  顺便说一下各个库
    MySQL-python:又叫 MySQLdb,是用的比较多的一种驱动,基于C开发的库,可是它只支持python2.X,而且在windows平台经常抽风。
    mysqlclient:这个据说是django ORM的依赖工具,之后可视化部分我应该也会用到django。
    pymysql:这个是纯Python实现的,最大的优点就是安装so easy ,我刚接触python+mysql时,选择了这个,所以就一直用这个库来操作mysql了。
    peewee:ORM框架,如果对Django的ORM操作很熟悉的话,这个就so_easy了,但是我觉得很麻烦,哈哈哈。
    SQLachemy :这个不错,既支持原生SQL,也支持ORM,pandas操作中会涉及这个。
 
pandas xjb一顿操作:
  这也是为什么我要写文章巩固梳理的地方,数据操作重点就在这里。
 
可视化操作:
  可视化(excel,python可视化库,在线制图,以及非常牛逼的highcharts,echarts web交互)。
  表比文字好,图比表好。
  人要穿衣服,但是衣服也有漂亮和丑之分,如果目的仅仅是穿衣服,那么随便穿,只要掩体就行,可视化也是一个道理,图表有装逼和不装逼之分,关键看你只是达到目的,还是为了更美观。
  excel:这个如果是默认的图表确实不够炫酷,但是可以调得非常美观,比如这个还看得过去吧。
  
 

  python可视化库:bokeh,matplotlib等等等,都不错,也是得靠手工调才能显逼格的。

  在线制图:我平时用到的,只是为了偷懒,比如用pandas把数据整出来了,要做个云词图,直接百度一个在线云词图工具,数据甩进去就好了,怎么快怎么搞,而且更美观。

  highcharts,echarts:只能说很牛逼,这个。如果搞web的话,直接用js接入这两个的其中一个就行了,交互式图表,更加符合现代互联网企业的发展。这两个相比较,我更倾向于echarts,但是手上的报表系统是highcharts的,所以highcharts的参数我更熟悉一点,如果真要美观,装逼,高大上的话,还是入手echarts吧。
https://www.hcharts.cn/docs/basic-title
http://echarts.baidu.com/tutorial.html

 
总结:
  介绍了基本情况,下面进入半桶子水时刻,qq1749061919 (欢迎交流,共同进步)
 
 

python requests抓取NBA球员数据,pandas进行数据分析,echarts进行可视化 (前言)的更多相关文章

  1. python+requests抓取页面图片

    前言: 学完requests库后,想到可以利用python+requests爬取页面图片,想到实战一下.依照现在所学只能爬取图片在html页面的而不能爬取由JavaScript生成的图片,所以我选取饿 ...

  2. python+fiddler 抓取抖音数据包并下载抖音视频

    这个我们要下载视频,那么肯定首先去找抖音视频的url地址,那么这个地址肯定在json格式的数据包中,所以我们就去专门查看json格式数据包 这个怎么找我就不用了,直接看结果吧 你找json包,可以选大 ...

  3. python requests抓取猫眼电影

    1. 网址:http://maoyan.com/board/4? 2. 代码: import json from multiprocessing import Pool import requests ...

  4. python抓取NBA现役球员基本信息数据

    链接:http://china.nba.com/playerindex/ 所需获取JSON数据页面链接:http://china.nba.com/static/data/league/playerli ...

  5. python抓取NBA现役球员基本信息数据并进行分析

    链接:http://china.nba.com/playerindex/ 所需获取JSON数据页面链接:http://china.nba.com/static/data/league/playerli ...

  6. Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

  7. Python爬虫之抓取豆瓣影评数据

    脚本功能: 1.访问豆瓣最受欢迎影评页面(http://movie.douban.com/review/best/?start=0),抓取所有影评数据中的标题.作者.影片以及影评信息 2.将抓取的信息 ...

  8. selenium抓取动态网页数据

    1.selenium抓取动态网页数据基础介绍 1.1 什么是AJAX AJAX(Asynchronouse JavaScript And XML:异步JavaScript和XML)通过在后台与服务器进 ...

  9. python Web抓取(一)[没写完]

    需要的模块: python web抓取通过: webbrowser:是python自带的,打开浏览器获取指定页面 requests:从因特网上下载文件和网页 Beautiful Soup:解析HTML ...

随机推荐

  1. Docker中搭建zookeeper集群

    1.获取官方镜像 从dockerhub获取官方的zookeeper镜像: docker pull zookeeper 2.了解镜像内容 拉取完镜像后,通过 docker inspect zookeep ...

  2. 笨鸟先飞之ASP.NET MVC系列之过滤器(06异常过滤器)

    概念介绍 异常过滤器主要在我们方法中出现异常的时候触发,一般我们用 异常过滤器 记录日志,或者在产生异常时做友好的处理 如果我们需要创建异常过滤器需要实现IExceptionFilter接口. nam ...

  3. Azure 基础:使用 powershell 创建虚拟机

    在进行与 azure 相关的自动化过程中,创建虚拟主机是避不开的操作.由于系统本身的复杂性,很难用一两条简单的命令完成虚拟主机的创建.所以专门写一篇文章来记录使用 PowerShell 在 azure ...

  4. expected single matching bean but found 2

    org.springframework.beans.factory.UnsatisfiedDependencyException: Error creating bean with name 'acc ...

  5. How to change your password of your mysql account in WampServer

    #1. use phpmyadmin to login mysql and click the account menu, and then click "Change the passwo ...

  6. C#设计模式--简单工厂模式

    简单工厂模式是属于创建型模式,但不属于23种GOF设计模式之一. 举一个例子:一个公司有不同的部门,客户根据需要打电话到不同的部门.客户相当于上端,不同部门相当于下端.不使用简单工厂模式来实现的例子如 ...

  7. 在VM12中安装 RedHat RHEL7.2  系统的详细步骤

    一.开始安装 1)新建虚拟机 RHEL7.2 2)成功引导系统--开机出现此画面 Install Red Hat EnterpriseLinux 7.2  安装RHLE7.2 操作系统 Test th ...

  8. 用ajax的同步请求解决登陆注册需要根据服务器返回数据判断是否能提交的问题

    最近在写www.doubilaile.com的登陆注册.需要用ajax请求服务器判断用户名是否存在,用户名和密码是否匹配,进而提交数据.碰到的问题是异步请求都能成功返回数据,但是该数据不能作为紧接着的 ...

  9. sed命令详解 vim高级技巧 shell编程上

    第1章 sed命令详解 1.1 查找固定的某一行 1.1.1 awk命令方法 [root@znix ~]# awk '!/oldboy/' person.txt 102,zhangyao,CTO 10 ...

  10. 开发一个基于 Android系统车载智能APP

    很久之前就想做一个车载相关的app.需要实现如下功能: (1)每0.2秒更新一次当前车辆的最新速度值. (2)可控制性记录行驶里程. (3)不连接网络情况下获取当前车辆位置.如(北京市X区X路X号) ...