1.mongoDB简介

1.1 NoSQL数据库

  • 数据库:进行高效的、有规则的进行数据持久化存储的软件

  • NoSQL数据库:Not only sql,指代非关系型数据库

    • 优点:高可扩展性、分布式计算、低成本、灵活架构、半结构化数据、简化关联关系

    • 缺点:没有标准化、有限查询、不直观

  • 常见NoSQL数据库

    • 列存储:Hbase、Cassandra、Hypertable

    • 文档存储:MongoDB、CouchDB

    • k-v存储:TokyoCabinet、BerkeleyDB、MemcacheDB、redis

    • 对象存储:Neo4J、Versant

    • Xml数据库:BerkeleyDB、BaseX

注:黑色加粗的为常用的数据库

1.2.MongoDB概述

MongoDB 是一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。

MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。

优点:

  • C++编写的运行稳定性能高的数据
  • 模式自由
  • 面向集合
  • 完整索引支持
  • 复制和高可用性

1.3.Mongodb术语解释

  • database--database:数据库
  • table – collection:数据库表 – 集合
  • row – document: 数据记录 – 文档
  • column – field:数据字段 – 域
  • index – index :索引 – 索引
  • table-join – None:表连接~
  • primary key – primary key :主键

1.4.MongoDB基本语法——数据类型

  • 集合就是关系型书库中的表

  • 文档对应关系型数据库中的行

  • 文档:就是一个JSON对象,由KEY=VALUE键值对构成

{“name”:”admin”, “gender”:”男”}

集合:存储多个文档,结构不固定

{“name”:”admin”, “gender”:”男”}
{“name”:”manager”, “age”:23}
{“name”:”manager”, “phone”:”16868686868”}
  • 数据库:存储多个集合

  • 服务器:一个服务器中可以包含多个数据库

  • ObjectID:文档id
  • String:字符串
  • Boolean:布尔值
  • Integer:整数
  • Double:浮点数
  • Arrays:数组或者列表
  • Object:嵌入的文档
  • Null:空值
  • Timestamp:时间戳
  • Date:日期时间

2.Mongodb下载安装

  • 官方网站
    注意:偶数为稳定版,如1.6,奇数为开发版,如1.7

2.1.Windows下Mongodb安装

直接下载msi文件或者点击All Verison Binaries下载都行

我这里用的是zip安装,安装完毕后,

mongo文件夹中创建db文件夹和log文件夹
  • 在cmd窗口输入命令启动数据库
mongod --dbpath D:\软件安装\MongoDB\data\db(此处是db的路径)
  • 打开一个新的窗口输入命令mongo,用于数据库操作

2.2.Linux下Mongodb安装

MongoDB安装很简单,无需下载源文件,可以直接用apt-get命令进行安装。

1 . 打开终端,输入以下命令:

sudo apt-get install mongodb

2 . 安装完成后,在终端输入以下命令查看MongoDB版本:

mongo -version

显示版本信息,即安装成功

3 . 启动mongo数据库

在终端输入命令

sudo mongo

3.安装pymongo

PyMongo是Mongodb的Python接口开发包,是使用python和Mongodb的推荐方式。

用Python操作MongoDB需要通过PyMongo,输入命令安装

pip install pymongo          默认安装
pip install pymongo==2.8      安装指定版本
pip install –upgrade pymongo   升级PyMongo

安装成功

命令运行成功无报错

4.Mongodb基本使用

4.1.基本操作

  • mongoDB将数据存储为一个文档

  • 数据由 key=value 的键值对的形式组成

  • 数据的操作:增删改查

  • nosql三元素:数据库 – 集合 – 文档 [--域]

4.2.基本语法

  • 数据库操作

    • db:查看当前指向的数据库

    • show dbs:查看当前所有的数据库

    • use <数据库名称>:指向一个数据库
      Use数据库不会创建数据库,如果操作数据会自动创建数据库

    • db.dropDatabase():删除当前指向的数据库

  • 集合操作

    • show collections:查看当前数据库所有集合

    • db.createCollection(<c_name> [, options]):创建一个集合

    • db.<集合名称>.drop():删除指定的集合

show collections 查看当前库中所有的集合,后面的collections不要加括号

db.createCollection(name, [optinos])
创建一个名称为name的集合,后面的options表示创建的附带选项
db.createCollection(“emp”):创建一个名称为emp的名称的集合
db.createCollection(“dept”, {“capped”: true, size: 5}):capped默认false
表示不设置上限,true表示设置上限需要设置size参数~表示达到上限时会将之前的数据覆盖
  • 增加数据

    • 语法:db.<集合名称>.insert(文档)

    • 集合可以是原来存在的,可以是不存在的

    • 文档:就是JSON格式表示的数据

    • 简单查询:db.<集合名称>.find()查询指定集合的数据

db.student.insert({name:”jerry”, gender:”男”})

db.student.insert({_id:”1”, name:”tom”, gender:”女”, age:18})
  • 更新数据

    • 语法:db.<集合名称>.update(<query>, <update>,[multi:<boolean>])

    • 指定属性更新:$opration

    • multi:默认false更新符合条件第一条,设置true全集合更新

#更新符合条件的文档
db.student.update({name:”tom”}, {name:”jerry”})

#更新符合条件的文档中符合条件的域
db.student.update({name:”tom”}, {$set:{name:”jerry”}})

#更新符合条件的多行文档及对应的域
db.student.update({}, {$set:{name:”donghua”}}, {multi:true})
  • 保存数据

    • 语法:db.<集合名称>.save(文档)

    • 特征:[ _id ]如果数据不存在就添加,如果数据存在修改

  • 删除数据

    • 语法:db.<集合名称>.remove(<query>, {justone:<boolean>})

    • 参数query:删除文档的条件

    • 参数justOne:设置为true或者1,删除一条;默认false删除多条


查询数据

  • 基本查询

    • find([{文档条件}]):全集合查询

    • findOne([{文档条件}]):查询第一个

    • pretty():将查询结果格式化展示

  • 比较运算符

 默认判断,无运算符
 $lt:little~小于 <
 $lte:little or equals~小于等于 <=

 $gt:granter~大于 >
 $gte:granter or equals~大于等于 >=

#查询名称为jerry的学生
db.student.find({name:”jerry”})

#查询年龄已经适婚年龄的学员
db.student.find({age:{$gte:20}})
  • 逻辑运算符

    • 逻辑与:并且运算,默认操作,无运算符

    • 逻辑或:或者运算,$or

#查询年龄已经适婚年龄并且性别为女的学员
db.student.find({age:{$gte:20}, gender:”女”})

#查询年龄大于18或者性别为男的学员
db.student.find({$or:[{age:{$gt:18}, {gender:”女”}]})
  • 范围运算符

    • $in:判断指定条件是否包含在某个范围内

    • $nin:判断指定条件是否不包含在某个范围内

#查询年龄在18或者20的学员
db.student.find({age: {$in:[18,20]}})

#查询年龄不是18 的学员
db.student.find({age: {$nin : [20]}})
  • 限制查询条数
 <find>.limit(count)
  • 排序
<find>.sort({字段:1/-1, ...})
db.student.find().sort({name:1})
    1.表示升序排列 -1表示降序排列,可以指定多个字段
  • 统计
<find>.count()

 db.<集合名称>.count({条件})

两种操作方式
1.查询结果,通过count()统计数据
2. 通过count()直接添加条件统计数据
  • 去重
db.<集合名称>.distinct(“去重域名称”, {条件})

查询数据列表中,所有的年龄分布情况
db.student.distinct(“age”, {})
  • 分页
#隔n个数据查询m个数据
db.hero.find().pretty().limit(m).skip(n)

5.Mongodb与python交互

之前学习了爬虫,现在我们把爬取得到的数据存储于Mongodb中

#爬取英雄联盟英雄信息详情,并存储

#-*- coding:utf-8 -*-
import pymongo
import requests
from bs4 import BeautifulSoup

#建立于MongoClient 的连接
client = pymongo.MongoClient('localhost',27017)
#得到数据库
hero = client['hero']
#得到一个数据集合
sheet_tab = hero['sheet_tab']
url = 'http://lol.duowan.com/hero/'
req = requests.get(url)
soup = BeautifulSoup(req.text,'html.parser')
links = soup.find(id="champion_list").find_all('a')
for link in links:
    link = link['href']
    requ = requests.get(link)
    sop = BeautifulSoup(requ.text,'html.parser')
    data = {
    'title' : sop.find('h2',class_="hero-title").get_text(),
    'name' : sop.find('h1',class_="hero-name").get_text(),
    'tags' : sop.find('div',class_="hero-box ext-attr").find_all('span')[1].get_text(),
    'story' : sop.find('div',class_="hero-popup").find_all('p')[0].get_text(),
    }
    sheet_tab.insert_one(data)

开启mongo,运行代码

通过Robo 3T可视化工具我们可以看到抓取到了137条数据,并且已存储到mongodb中

mongoDB的安装及基本使用的更多相关文章

  1. MongoDB下载安装与简单增删改查

    Windows下MongoDB的安装和配置.启动和停止 下载地址:MongoDB的官方下载网址是:https://www.mongodb.org/downloads 安装步骤1. 点击下载的mongo ...

  2. MongoDB的安装与设置MongoDB服务

    Mongo DB 是目前在IT行业非常流行的一种非关系型数据库(NoSql),其灵活的数据存储方式备受当前IT从业人员的青睐.Mongo DB很好的实现了面向对象的思想(OO思想),在Mongo DB ...

  3. Linux下MongoDB服务安装

    Linux下MongoDB服务安装 MongoDB是一个基于分布式文件存储的数据库.由C++语言编写.旨在为WEB应用提供可扩展的高性能数据存储解决方案.MongoDB是一个介于关系数据库和非关系数据 ...

  4. MongoDB学习-安装流程

    MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的. 支持的数据结构非常松散,是类似json的bjson格式,因此可以存储比较复杂的数据类型. ...

  5. mongodb(二) 安装和使用

    mongodb的安装和使用 最近的项目需要使用到mongodb,从而开始熟悉nosql,有了本篇文章,记录和方便他人. mongodb的安装 下载地址:http://www.mongodb.org/d ...

  6. MongoDB的安装及配置

    MongoDB 是目前在IT行业非常流行的一种非关系型数据库(NoSql),其灵活的数据存储方式备受当前IT从业人员的青睐. Windows (1). 登录Mongodb官网点击下载 (2). 将zi ...

  7. MongoDB的安装 转

    第1章 MongoDB的安装 (黎明你好原创作品,转载请注明) 1.1 MongoDB简介 MongoDB是一个基于分布式文件存储的数据库开源项目.由C++语言编写,旨在为WEB应用提供可护展的高性能 ...

  8. MongoDB的安装,配置与开机自启动

    关于简介不多说百度去吧少年.. MongoDB详细安装: 1.进入官网,点击DOWNLOAD MONGODB,下载所需要的版本.. 我这里把下载的文件放在d\MongoDB文件夹下,点击下载的官方镜像 ...

  9. MongoDB(二)——安装配置了解

    前边介绍了MongoDB的大概理论知识,这篇来对MongoDB进行一下安装使用,支持安装在windows和linux上,当然了很多其它情况下我们是安装在linux上,由于毕竟server用linux的 ...

  10. MongoDB本地安装与启用(windows )

    MongoDB的安装与MongoDB服务配置 Mongo DB 是目前在IT行业非常流行的一种非关系型数据库(NoSql),其灵活的数据存储方式备受当前IT从业人员的青睐.Mongo DB很好的实现了 ...

随机推荐

  1. Android高效率编码-第三方SDK详解系列(一)——百度地图,绘制,覆盖物,导航,定位,细腻分解!

    Android高效率编码-第三方SDK详解系列(一)--百度地图,绘制,覆盖物,导航,定位,细腻分解! 这是一个系列,但是我也不确定具体会更新多少期,最近很忙,主要还是效率的问题,所以一些有效的东西还 ...

  2. Linux内核中断和异常分析(下)

    这节,我们继续上,中(以前的日志有)篇目进行分析,结合一个真实的驱动案例来描述linux内核中驱动的中断机制,首先我们先了解一下linux内核中提供的中断接口. 这个接口我们需要包含一个头文件:#in ...

  3. 面试之路(3)-详解MVC,MVP,MVVM

    一:mvc mvc结构: 视图(View):用户界面. 控制器(Controller):业务逻辑 模型(Model):数据保存 mvc各部分的通信方式 mvc互动模式 通过 View 接受指令,传递给 ...

  4. html的meta标签

    meta是一个空元素,没有结束标签:meta元素可以附带8个属性,其中4个是通用属性-–dir,lang,xml:lang和title,其他4个是meta特有的属性: schema,name,cont ...

  5. Jmeter(二十四)_服务器性能监控

    下载插件 1.访问网址http://jmeter-plugins.org/downloads/all/,下载三个文件.其中JMeterPlugins-Standard和JMeterPlugins-Ex ...

  6. Android studio统计项目总行数

    有时候在项目开发中会用到统计项目的总行数功能,今天就教大家如何利用studio进行总行数的统计: 1.打开要统计总行数的项目,按住Ctrl+Shift+A(或者点击导航栏的Help->Find ...

  7. VMware虚拟化培训手册

    一.VMware虚拟化架构概述 1.1VMware虚拟化架构图 如上图所示,虚拟化由物理主机(即ESXI主机).虚拟化管理程序(vCenter Server).虚拟机(操作系统).存储等基本组成. 1 ...

  8. oracle数据库中的trim不起作用

    在项目中使用datastage软件将sqlserver数据库的数据导入到oracle中的时候,出现了一些空格,然而使用trim相对应的字段发现没有作用,空格还存在,并没有去掉. 使用length(.. ...

  9. jsoup 使用总结1--添加header

    jsoup 使用总结1--添加header 大部分时候,我们使用jsoup解析网页的是否都是直接Jsoup.connect(url); 孰不知,我们可以添加header,例如 Host, Refere ...

  10. EF Code First中的主外键约定和一对一、一对多关系的实现

    对于主外键约定的理解,其实是学习实体间一对一和一对多关系的基础. 1.1 主键(Key)约定 主键的默认约定是:只要字段名为--实体名(类名)+"id"(不区分大小写),这就算是默 ...