目前图数据库软件七种较为流行:Neo4J, Infinite Graph, DEX,InfoGrid, HyperGraphDB, Trinity,
AllegroGraph(http://tech.it168.com/a2012/0112/1302/000001302117_all.shtml

•       Neo4j - 开源的Java属性图形模型

•       AllegroGraph,闭源,RDF-QuadStore

•       HyergraphDB - 开源的Java超图模型

此外还有

•       Sones - 闭源,关注于.NET

•       Virtuoso - 闭源,关注于RDF

•       Others like Filament、FlockDB等。

要想选择NoSQL数据库,首先需要对其类型有所了解,目前NoSQL数据库主要分析四大类型:文档型数据库、键值存储、列式存储和图数据库。作为NoSQL数据库,它们都具备扩展性强、动态的数据库设计等特点。但每种类型又都有各自的特性。Gartner分析师Nick Heudecker表示:“要选择一种NoSQL数据库,你需要先了解自己的数据,其次了解你的应用需要如何使用这些数据。”

文档数据库适合多种数据类型



例如,文档数据库经常用于内容管理系统,收集和处理来自网页和移动应用的数据,比如应用监控。顾名思义,文档数据库以类似文档的结构存储数据,可以采用无模式的形式。MongoDB、CouchDB、Couchbase Server和MarkLogic是典型的文档数据库。



Simone介绍到,花旗集团使用MongoDB解决了网络金融应用的数据复制问题。最开始,这一应用是建立在关系型数据库上的,但是由于数据结构多种多样,所以关系型数据库处理起来特别慢,而且经常出错。“我们很快认识到,数据格式已经成为一种挑战。”



而对于高速演进的应用程序,MongoDB特别适合支持这种动态模式。Simone表示使用MongoDB以后,他们可以对任何数据进行建模。而且,建模速度也快了很多。开发团队只需要4个月就可以构建出预生产模型。



键值数据库简化IT



诸如Redis、Aerospike和Riak等键值数据库是形式最简单的NoSQL软件。数据中的每一个值都有专门的键(key)与之匹配,能够实现针对相对简单数据集的超快应用性能。美国咨询和技术服务供应商Caserta Concepts总裁Joe Caserta表示:“键值存储是轻量级的,用户可以实现秒级的浏览和查询。”



Flywheel软件公司是国外提供打车软件的公司,它采用Basho开发Riak软件支持移动应用。Flywheel的前首席架构师Cuyler Jones介绍到,他还在任的时候,数据库还可以通过扩展应对峰值,不过因为Riak的高可用性和对持续的数据访问的支持,公司已经采用了Riak。



列式数据库应对海量数据



列式存储在拥有大量列的表中存储数据,在处理大数据集的时候,就可以具备更高的性能和扩展性。通常应用于互联网搜索、其他大规模的网页应用和PB级的分析应用,典型的列式数据库包括Accumulo、Cassandra和HBase



2012年,Ancestry.com推出的DNA匹配应用采用的就是列式存储。开发经理Jeremy Pollack介绍到,公司是家族历史数据的线上供应商,公司在计算DNA的时候采用的HBase+Hadoop的架构,顾客可以通过他们网站追溯自己的家族背景、地理起源,并且寻找亲属。



Pollack说到,HBase应用起来很麻烦(+本站微信networkworldweixin),要想获得理想的性能,需要大量的调试。HBase有上百万个按钮,根本就是个体力活。不过,应用了NoSQL技术,Ancestry能够快速匹配70万新数据,并存储了大量的DNA样本。



图数据库表现数据关系



图数据库,以InfiniteGraph和Neo4j为代表,以类似于图的结构存储数据,便于探索数据之间的联系,可应用于产品推荐和社交网络。英国医疗网站HealthUnlocked的技术负责人Alex Trofymenko表示,图数据库可以用来匹配不同人之间和人与兴趣之间的关系。



Trofymenko表示,公司使用的是Neo技术公司提供的Neo4j。“我们可以从图数据库中获得很多信息,比如某个用户更关注糖尿病问题还是更关注体育锻炼”这对于网站来说很重要,我们可以在成百上千的搜索记录中找到用户和相关健康问题的关系,搭建一个数据平台,帮助用户找到合适的治疗方法和保健服务。

转自网界网:http://software.cnw.com.cn/software-database/htm2014/20140817_310141.shtml

noSQL数据库相关软件介绍(大数据存储时候,必须使用)的更多相关文章

  1. MapGis如何实现WebGIS分布式大数据存储的

    作为解决方案厂商,MapGis是如何实现分布式大数据存储的呢? MapGIS在传统关系型空间数据库引擎MapGIS SDE的基础之上,针对地理大数据的特点,构建了MapGIS DataStore分布式 ...

  2. Hadoop优势,组成的相关架构,大数据生态体系下的模式

    Hadoop优势,组成的相关架构,大数据生态体系下的模式 一.Hadoop的优势 二.Hadoop的组成 2.1 HDFS架构 2.2 Yarn架构 2.3 MapReduce架构 三.大数据生态体系 ...

  3. 大数据存储:MongoDB实战指南——常见问题解答

    锁粒度与并发性能怎么样? 数据库的读写并发性能与锁的粒度息息相关,不管是读操作还是写操作开始运行时,都会请求相应的锁资源,如果请求不到,操作就会被阻塞.读操作请求的是读锁,能够与其它读操作共享,但是当 ...

  4. Sqlserver 高并发和大数据存储方案

    Sqlserver 高并发和大数据存储方案 随着用户的日益递增,日活和峰值的暴涨,数据库处理性能面临着巨大的挑战.下面分享下对实际10万+峰值的平台的数据库优化方案.与大家一起讨论,互相学习提高!   ...

  5. 从 RAID 到 Hadoop Hdfs 『大数据存储的进化史』

    我们都知道现在大数据存储用的基本都是 Hadoop Hdfs ,但在 Hadoop 诞生之前,我们都是如何存储大量数据的呢?这次我们不聊技术架构什么的,而是从技术演化的角度来看看 Hadoop Hdf ...

  6. 大数据存储的进化史 --从 RAID 到 Hdfs

    我们都知道现在大数据存储用的基本都是 Hdfs ,但在 Hadoop 诞生之前,我们都是如何存储大量数据的呢?这次我们不聊技术架构什么的,而是从技术演化的角度来看看 Hadoop Hdfs. 我们先来 ...

  7. 【SQL server初级】数据库性能优化一:数据库自身优化(大数据量)

    数据库优化包含以下三部分,数据库自身的优化,数据库表优化,程序操作优化.此文为第一部分 数据库性能优化一:数据库自身优化 优化①:增加次数据文件,设置文件自动增长(粗略数据分区) 1.1:增加次数据文 ...

  8. 快速构建大数据存储分析平台-ELK平台安装

    一.概述 ELK是由Elastic公司开发的Elasticsearch.Logstash.Kibana三款开源软件的缩写(但不限于这三款软件). 为什么使用ELK? 在目前流行的微服务架构中,一个大型 ...

  9. 环境搭建 Hadoop+Hive(orcfile格式)+Presto实现大数据存储查询一

    一.前言 Hadoop简介 Hadoop就是一个实现了Google云计算系统的开源系统,包括并行计算模型Map/Reduce,分布式文件系统HDFS,以及分布式数据库Hbase,同时Hadoop的相关 ...

随机推荐

  1. 各种异常 及异常类和Object类

    Day05 异常 Object类 equals方法,用于比较两个对象是否相同,它其实就是使用两个对象的内存地址在比较.Object类中的equals方法内部使用的就是==比较运算符. 2. 描述人这个 ...

  2. 从头开始搭建一个VSCode+NetCore的项目

    看这个前,先要对VS开发C#有所了解 获取作案工具 NetCore SDK https://www.microsoft.com/net/learn/get-started/windows 安装 建立工 ...

  3. 在ubuntu上安装最新稳定版本的node及npm

    背景 通过ubuntu官方apt安装工具安装的node是最新LTS版本的,而本人是个有点强迫症的人,喜欢追求新的东西,也就是想方设法想要去安装最新版本的node,所以本文也就产生了,附上ubuntu安 ...

  4. CodeBlocks使用小技巧

    1.基本使用: CodeBlocks使用介绍 2.一定要建项目才能编译运行代码吗? 不一定,也可以直接新建文件,直接运行. 如何管理这些未纳入项目的文件?通过左侧Management面板,切换到Fil ...

  5. Android的四大组件及应用安装安全问题(4)

    Android的四大组件及组件间通信 如果想对四大组件有深入的了解,那永远不要停留在一些条条干干的SDK API的认识,需要了解他的通讯,他的复用,他的边界问题,这样才会对四大组件有透明的认识. 四大 ...

  6. Java对象的访问定位

    java对象在访问的时候,我们需要通过java虚拟机栈的reference类型的数据去操作具体的对象.由于reference类型在java虚拟机规范中只规定了一个对象的引用,并没有定义这个这个引用应该 ...

  7. Hadoop 伪分布式安装、运行测试例子

    1. 配置linux系统环境 centos 6.4 下载地址:http://pan.baidu.com/s/1geoSWuv[VMWare专用CentOS.rar](安装打包好的VM压缩包) 并配置虚 ...

  8. Vc2015 utf8 格式出错

    Vc2015 utf8 格式出错(金庆的专栏)用Vc2015新建一个项目,如下添加一行中文注释.然后将这个文件改为utf8无BOM格式,再转换行结束符为Unix格式.#include "st ...

  9. SQLite 创建数据库(http://www.w3cschool.cc/sqlite/sqlite-create-database.html)

    SQLite 创建数据库 SQLite 的 sqlite3 命令被用来创建新的 SQLite 数据库.您不需要任何特殊的权限即可创建一个数据. 语法 sqlite3 命令的基本语法如下: $sqlit ...

  10. JBOSS EAP 6 系列五 Managed domains 管理域最主要的功能是“统一部署,统一配置”

    摘要 本文首先介绍Managed Domain的概念,管理域最主要的功能是"统一部署,统一配置".接下来通过一个实例在"统一配置"部分实现一个双机配置起来的域, ...