PLUTO平台是由美林数据技术股份有限公司下属西安交大美林数据挖掘研究中心自主研发的一款基于云计算技术架构的数据挖掘产品,产品设计严格遵循国际数据挖掘标准CRISP-DM(跨行业数据挖掘过程标准),具备完备的数据准备、模型构建、模型评估、模型管理、海量数据处理和高纬数据可视化分析能力。
http://www.meritdata.com.cn/article/90
PLUTO平台是由美林数据技术股份有限公司下属西安交大美林数据挖掘研究中心自主研发的一款基于云计算技术架构的数据挖掘产品,产品设计严格遵循国际数据挖掘标准CRISP-DM(跨行业数据挖掘过程标准),具备完备的数据准备、模型构建、模型评估、模型管理、海量数据处理和高纬数据可视化分析能力。
Pluto平台设计严格遵循国际数据挖掘标准CRISP-DM(跨行业数据挖掘过程标准)。Pluto强大的数据挖掘功能将复杂的统计方法和机器学习技术应用到业务数据当中,帮助客户揭示隐藏在业务系统和企业资源计划、结构数据库和普通文件等信息中的模式和趋势,让客户始终站在行业发展的前端。
Pluto具有完备的数据准备、数据处理、模型构建、模型评估、模型管理和结果展现功能,具有系统性、开放性、流程性和服务性等特征。可以帮助企业从业务数据中挖掘规律,并对关键问题做出预测,并可以应用模型部署到业务流程中,提高决策效率和执行力。目前已经成功应用于智能电网、制造业、航空航天、政府及公共服务业、电信业务和证券金融等众多领域。
二、产品特点
Pluto为多种商业问题和研究问题提供了基本的分析功能,架构如下图示:

Pluto以数据挖掘过程为基础,提供对数据文件、数据库等数据源的支持。数据挖掘平台通过数据的清理准备工作,用科学的数据挖掘方法建立模型,最终以图形或者表格等可视化的方式将数据挖掘的结果展示给用户,并支持模型参数调优。业务模型可发布为多种服务,供外部系统集成调用。
1.平台框架
平台框架是Pluto数据挖掘平台的基础运行环境,主要包括:算法动态注册、消息通知、数据传输、数据存储、数据缓存等功能。
1)算法动态注册
算法动态注册基于OSGI机制,可以在软件不停止运行、不重新对源代码进行编译的状态下,将新增算法动态注册到平台中,具有良好的扩展性与开放性。
2)大数据支撑
一方面平台数据加载与处理采用内存映射文件机制,另一方面平台算法利用增量学习和优化内存结构的矩阵模型,不仅增强对大数据的处理规模,而且提高了数据挖掘算法的处理效率。
3)数据缓存
平台数据预处理节点和模型节点都实现了数据处理结果的缓存功能,从而可以根据需要指定流程从最后一个有缓存数据的节点开始运行,极大的提高了数据挖掘流程的运行效率。
2.数据源
Pluto数据源支持文件和数据库,文件支持文本文件(*.txt,*.csv)和Excel文件(*.xls,*.xlsx),数据库支持oracle(9i、10g、11g)、SqlServler(2005、2008)、DB2、MySql等常用类型,同时支持列式数据库的接入。
3.数据预处理
数据预处理主要实现数据的清理准备工作,包括样本处理和属性操作。样本处理包括条件抽样、简单抽样、平衡、汇总和样本排序等功能,属性操作包括指定因变量、属性选择、属性变换、离散化、数据集拆分、分箱和数据降维等功能。
4.领先的数据挖掘算法
Pluto包含经典算法20个和高效的自主算法10个。
其中国内独有的L1/2稀疏迭代算法、视觉聚类算法分别在长流程制造工艺分析和图形处理方面具有特殊优势。用户可以从多种算法中选择来进行预测、聚类、关联、分类等操作。Pluto算法支持主流云计算技术框架(Hadoop、Enomalism、Euclyptus等),实现海量数据的分析与挖掘。
5.模型构建与评估
模型构建是指训练并得到数据挖掘模型,模型评估帮助用户对数据挖掘模型的结果进行准确度分析,用户可根据模型评估结果的满意度对模型参数进行调优。
6.丰富的数据可视化
平台提供了10余种图形化技术和输出报告,帮助用户理解数据间的关键性信息,并指导用户以最便捷的途径找到问题的最终解决办法。
7.模型流程发布
模型流程发布是将数据挖掘模型流程发布为服务,包括Webservice服务和JMS服务,支撑外部系统的数据挖掘分析功能。同时,平台支持模型流程jar包导出,提供Java Jar API便于将模型流程直接集成到外部系统的开发环境。
8.模型流程服务管理
模型流程服务管理用于对平台发布的数据挖掘模型流程服务进行管理,包括服务的权限管理、版本管理和预测评估任务管理等功能。
9.服务访问接口
第三方(或外部)系统可以通过调用Webservice服务、JMS服务或直接调用Java Jar API进行数据挖掘分析功能的构建。
PLUTO平台是由美林数据技术股份有限公司下属西安交大美林数据挖掘研究中心自主研发的一款基于云计算技术架构的数据挖掘产品,产品设计严格遵循国际数据挖掘标准CRISP-DM(跨行业数据挖掘过程标准),具备完备的数据准备、模型构建、模型评估、模型管理、海量数据处理和高纬数据可视化分析能力。的更多相关文章
- 从开发一款基于Vue技术栈的全栈热重载生产环境脚手架,我学到了什么
浏览文章前 这一期,我分享给大家三点看源码的小技巧,这也是从别的大佬那总结的. 被反复使用的代码 这样的代码是一个软件的重点函数,一个大神的写法有很多精华值得学习. 穿越时间的代码 如果一段代码10年 ...
- 一款基于Zigbee技术的智慧鱼塘系统研究与设计
在现代鱼塘养鱼中,主要困扰渔农的就是养殖成本问题.而鱼塘养殖成本最高的就是养殖的人工费,喂养的饲料费和鱼塘中高达几千瓦增氧机的消耗的电费.实现鱼塘自动化养殖将会很好地解决上述问题,大大提高渔农的经济效 ...
- 华为参与《基于5G技术的医院网络建设标准》的制定
[摘要] 5G 千兆网承载五地远程会诊,现场完成三例复杂性疑难重症远程病例讨论 [中国,北京,2019年9月4日] 金秋之际,在国家卫生健康委指导下,由中日友好医院•国家远程医疗与互联网医学中心•国家 ...
- 基于ETL技术的数字化校园共享数据中心设计
摘要:数据的抽取.转换与加载(ETL)是数据整合的核心过程.在分析高校信息化建设现状基础上,以建立数字化校园.整合数据资源.实现数据共享为目标,提出以ETL为基础建立共享数据中心实现数据整合的方案.介 ...
- angularJS1笔记-(18)-$http及用angular实现JSONP跨域访问过程
官网上的解释为: The $http service is a core AngularJS service that facilitates communication with the remot ...
- padding标准盒模型和怪异盒子模型
我们都知道padding是为块级元素设置内边距 但是在使用过程中,我们却会遇到一些问题.padding的标准盒模型和怪异盒模型 padding盒子模型 我们通过demo来讲这个问题,用文字干讲第一没意 ...
- Kubernetes——基于容器技术的分布式架构领先方案,它的目标是管理跨多个主机的容器,提供基本的部署,维护以及运用伸缩
1.Kubernetes介绍 1.1 简介 Kubernetes是什么?首先,它是一个全新的基于容器技术的分布式架构领先方案.其次,它是一个开放的开发平台.最后,它是一个完备的分布式系统支撑平台.Ku ...
- 标准盒模型与IE盒模型之间的转换
首先上图,这两张很明显可以看出IE盒模型和标准盒模型之间的差别. 当然今天不是去细细追究两种模型具体是怎么去计算布局的,那个很多文章已经已经有过了,不再重复.以前刚开始学习盒模型的时候,就学到的是IE ...
- w3c标准盒模型与IE传统模型的区别
一.盒子模型(box model) 在HTML文档中的每个元素被描绘为矩形盒子.确定其大小,属性——比如颜色.背景.边框,及其位置是渲染引擎的目标. CSS下这些矩形盒子由标准盒模型描述.这个模型描述 ...
随机推荐
- Bash 常用快捷方式
从历史中执行命令 ctrl +r 搜索历史命令记录 !$ 重复上一个命令参数 文本编辑的快捷方式 c 分别更改这些配对标点符号中的文本内容 di 分别删除这些配对标点符号中的文本内容 do ...
- HDU4004 二分答案
第一道二分答案...今天看了大牛的博客,突然发现有个叫“二分枚举答案”的方法好像很牛,于是便搜了些资料..发现并不是很难,可能是我了解的只是冰山一脚罢了...加油ACMer!!!! #include& ...
- Web前后端缓存技术(缓存的主要作用是什么)
Web前后端缓存技术Web前后端缓存技术(缓存的主要作用是什么) 一.总结 一句话总结: 加快页面打开速度 减少网络带宽消耗 降低服务器压力 1.在Web应用中,应用缓存的地方有哪些? 主要有浏览器缓 ...
- VS2012与windos版本不兼容问题
昨天晚上加完班,想着把windows更新下.今天上午就发现再运行VS报错了,提示VS2012与windows版本不兼容,打开.sln文件后,VS自动关闭.错误如下: 查看后网上提示安装VS2012的一 ...
- gin框架中间件
1. Gin框架中间件Gin框架中间件A. Gin框架允许在请求处理过程中,加入用户自己的钩子函数.这个钩子函数就叫中间件B. 因此,可以使用中间件处理一些公共业务逻辑,比如耗时统计,日志打印,登陆校 ...
- Python爬虫笔记【一】模拟用户访问之验证码清理(4)
清理图片,对图片进行二值化,去边框,去干扰线,去点 from PIL import Image from pytesseract import * from fnmatch import fnmatc ...
- svn查看指定版本提交信息的命令
通过svn命令查看指定版本提交的文件和日志信息 svn log -r ARG -v ARG :版本 可以是如下之一: NUMBER 版本号 '{' DATE '}' 在指定时间以后的版本 'HEAD' ...
- idea2018.1.5永久破解过程
可以根据官网推荐注册idea:http://idea.lanyus.com/ 步骤如下:1 下载破解(crack) jar 包 链接:https://pan.baidu.com/s/1-COPHVJi ...
- https方式nginx 代理tomcat访问不带www的域名301重定向跳转到www的域名帮助seo集中权重
比如我要把 http://gucanhui.com http://www.gucanhui.com 跳转到https://www.gucanhui.com 用F12的network可以看到状态码301 ...
- CHARINDEX函数
CHARINDEX函数返回字符或者字符串在另一个字符串中的起始位置.CHARINDEX函数调用方法如下: CHARINDEX ( expression1 , expression2 [ , st ...