转载博客 https://segmentfault.com/a/1190000005920679

根据自己的环境修改并配置mysql数据库

系统:Mac OS X 10.11

python 2.7

mysql安装

  • 使用brew安装mysql,启动mysql服务

    ☁  ~  brew install mysql
    Warning: mysql-5.7.18 already installed
    ☁ ~ which mysql
    /usr/local/bin/mysql
    ☁ ~ ls /usr/local/bin/mysql*
    /usr/local/bin/mysql /usr/local/bin/mysql_ssl_rsa_setup /usr/local/bin/mysqldumpslow
    /usr/local/bin/mysql.server /usr/local/bin/mysql_tzinfo_to_sql /usr/local/bin/mysqlimport
    /usr/local/bin/mysql_client_test /usr/local/bin/mysql_upgrade /usr/local/bin/mysqlpump
    /usr/local/bin/mysql_client_test_embedded /usr/local/bin/mysqladmin /usr/local/bin/mysqlshow
    /usr/local/bin/mysql_config /usr/local/bin/mysqlbinlog /usr/local/bin/mysqlslap
    /usr/local/bin/mysql_config_editor /usr/local/bin/mysqlcheck /usr/local/bin/mysqltest
    /usr/local/bin/mysql_embedded /usr/local/bin/mysqld /usr/local/bin/mysqltest_embedded
    /usr/local/bin/mysql_install_db /usr/local/bin/mysqld_multi /usr/local/bin/mysqlxtest
    /usr/local/bin/mysql_plugin /usr/local/bin/mysqld_safe
    /usr/local/bin/mysql_secure_installation /usr/local/bin/mysqldump
    ☁ ~ mysql.server start
    Starting MySQL
    . SUCCESS!
  • 数据库创建,表创建

    ☁  ~  mysql -u root -p
    Enter password:
    Welcome to the MySQL monitor. Commands end with ; or \g.
    Your MySQL connection id is 6
    Server version: 5.7.18 Homebrew Copyright (c) 2000, 2017, Oracle and/or its affiliates. All rights reserved. Oracle is a registered trademark of Oracle Corporation and/or its
    affiliates. Other names may be trademarks of their respective
    owners. Type 'help;' or '\h' for help. Type '\c' to clear the current input statement. mysql> show databases;
    +--------------------+
    | Database |
    +--------------------+
    | information_schema |
    | alt_web |
    | db_name |
    | db_tendenci |
    | douban |
    | mysql |
    | performance_schema |
    | sys |
    | testdb1 |
    +--------------------+
    9 rows in set (0.00 sec) mysql>create douban; #创建douban数据库
    mysql>use douban; #更换当前数据库
    #在douban数据库中,创建表douban
    mysql>create table douban(
    id INT NOT NULL AUTO_INCREMENT,
    class VARCHAR(100) NOT NULL,
    count INT NOT NULL,
    PRIMARY KEY( id )
    )ENGINE=InnoDB DEFAULT CHARSET=utf8;
    mysql> desc douban; #显示表结构
    +-------+--------------+------+-----+---------+----------------+
    | Field | Type | Null | Key | Default | Extra |
    +-------+--------------+------+-----+---------+----------------+
    | id | int(11) | NO | PRI | NULL | auto_increment |
    | class | varchar(100) | NO | | NULL | |
    | count | int(11) | NO | | NULL | |
    +-------+--------------+------+-----+---------+----------------+
    3 rows in set (0.01 sec)
  • mysql教程

python包安装

requests,lxml.etree,pymysql,matplotlib

  • 使用pip安装

    pip install packagename

下载源代码并运行

$ python demo.py

我的源码

https://github.com/MingjaLee/spiders_douban_movies

python爬虫: 豆瓣电影top250数据分析的更多相关文章

  1. python pandas 豆瓣电影 top250 数据分析

    豆瓣电影top250数据分析 数据来源(豆瓣电影top250) 爬虫代码比较简单 数据较为真实,可以进行初步的数据分析 可以将前面的几篇文章中的介绍的数据预处理的方法进行实践 最后用matplotli ...

  2. [Python]计算豆瓣电影TOP250的平均得分

    用python写的爬虫练习,感觉比golang要好写一点. import re import urllib origin_url = 'https://movie.douban.com/top250? ...

  3. Python爬虫-豆瓣电影 Top 250

    爬取的网页地址为:https://movie.douban.com/top250 打开网页后,可观察到:TOP250的电影被分成了10个页面来展示,每个页面有25个电影. 那么要爬取所有电影的信息,就 ...

  4. python爬虫-豆瓣电影的尝试

    一.背景介绍 1. 使用工具 Pycharm 2. 安装的第三方库 requests.BeautifulSoup 2.1 如何安装第三方库 File => Settings => Proj ...

  5. python爬虫 Scrapy2-- 爬取豆瓣电影TOP250

    sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003& ...

  6. Python爬虫----抓取豆瓣电影Top250

    有了上次利用python爬虫抓取糗事百科的经验,这次自己动手写了个爬虫抓取豆瓣电影Top250的简要信息. 1.观察url 首先观察一下网址的结构 http://movie.douban.com/to ...

  7. Python小爬虫——抓取豆瓣电影Top250数据

    python抓取豆瓣电影Top250数据 1.豆瓣地址:https://movie.douban.com/top250?start=25&filter= 2.主要流程是抓取该网址下的Top25 ...

  8. Python爬虫入门:爬取豆瓣电影TOP250

    一个很简单的爬虫. 从这里学习的,解释的挺好的:https://xlzd.me/2015/12/16/python-crawler-03 分享写这个代码用到了的学习的链接: BeautifulSoup ...

  9. [Python] 豆瓣电影top250爬虫

    1.分析 <li><div class="item">电影信息</div></li> 每个电影信息都是同样的格式,毕竟在服务器端是用 ...

随机推荐

  1. 搞定C系语言的的swap

    http://www.cs.utsa.edu/~wagner/CS2213/swap/swap.html 原地址 Parameters, by value and by reference: Both ...

  2. Polly+AspectCore实现熔断与降级机制

    Polly+AspectCore实现熔断与降级机制 https://www.cnblogs.com/edisonchou/p/9159644.html 一.熔断.降级与AOP 1.1 啥是熔断? 在广 ...

  3. B -- RE:从零开始的异世界生活 线段树

    http://www.ifrog.cc/acm/problem/1117?contest=1016&no=1 其实我是第一次这样用线段树. 首先把所有出现过的数字全部离散化.那么数字就是从[1 ...

  4. 渣渣菜鸡的 ElasticSearch 源码解析 —— 启动流程(上)

    关注我 转载请务必注明原创地址为:http://www.54tianzhisheng.cn/2018/08/11/es-code02/ 前提 上篇文章写了 ElasticSearch 源码解析 -- ...

  5. 机器学习框架ML.NET学习笔记【5】多元分类之手写数字识别(续)

    一.概述 上一篇文章我们利用ML.NET的多元分类算法实现了一个手写数字识别的例子,这个例子存在一个问题,就是输入的数据是预处理过的,很不直观,这次我们要直接通过图片来进行学习和判断.思路很简单,就是 ...

  6. c#的Lambda 表达式

    首先看官方的说法: Lambda 表达式是一种可用于创建委托或表达式目录树类型的匿名函数. 通过使用 lambda 表达式,可以写入可作为参数传递或作为函数调用值返回的本地函数. Lambda 表达式 ...

  7. Springboot优点总结

    谈到 Spring Boot,就让我们先来了解它的优点 . 依据官方的文档, Spring Boot 的优点如下: --创建独立的 Spring 应用程序 : --嵌入的 Tomcat . Jetty ...

  8. 使用Robot类模拟鼠标、键盘事件

    Robot类用于模拟鼠标.键盘事件,生成本机系统输入事件.Robot 的主要用于自动化.自运行的程序和其他需要自动控制鼠标和键盘的程序 相当于实际操作的效果,不仅仅只是生成对应的鼠标.键盘事件.比如R ...

  9. sql常用操作(三)多表查询

    1 连接查询 1.1连接就是指两个或2个以上的表(数据源)“连接起来成为一个数据源”. 实际上,两个表的完全的连接是这样的一个过程: 左边的表的每一行,跟右边的表的每一行,两两互相“横向对接”后所得到 ...

  10. 模态框的理解 ,jQ: loading,进度条, 省级联动 表单验证 插件

    模态框: 打开一个弹框 不关闭它就不能做框外的操作 必须关闭或弹出另外的弹框 加载延迟loading + 进度条只要有请求 就处理一下监控ajax 全局事件jquery: $('#box').ajax ...