H2O Driverless AI
H2O Driverless AI(H2O无驱动人工智能平台)是一个自动化的机器学习平台,它给你一个有着丰富经验的“数据科学家之盒”来完成你的算法。
使AI技术得到大规模应用
各地的企业都意识到人工智能应用程序是推动更好的客户体验和增加利润的关键。在每家公司中,都需要成千上万的AI模型来实现自动化和增强工作流程,并加速新数字产品的创新。现有的机器学习系统需要昂贵的数据科学人才,需要数月才能开发和部署单一模型,并生成业务和监管机构均不信任的“黑匣子”模型。 H2O Driverless AI是一种自动化的机器学习平台,使数据团队能够扩展并提供可信赖的生产就绪(production-ready)模型,以应对这些挑战。
填补人才缺口
数据科学家目前很短缺。增加能够开发生产就绪AI模型技术人员的数量是填补数据科学人才缺口的关键。使用DriverLess AI,刚入门的数据科学家,数据工程师,领域专家和统计学家可以开发出高精度的准备就绪可以部署的模型。DriverLess AI由专业数据科学家开发,该平台可以执行高级数据科学家的任务,而要达到高级科学家的程度可能需要多年的时间来学习和完善。
花更少的时间建立更多的模型
减少开发精确产品就绪模型的时间是使用AI解决大量业务挑战的关键。DriveLess AI自动执行耗时的数据科学任务,包括高级特征工程(也特征值选取相关的工程)、模型选取、超参数调整、模型堆叠和模型部署。这些处理过程是由GPU和CPU系统的高性能计算驱动的,它可以在几分钟内进行数以千次的结合和迭代,通过不断测试来找出最佳模型。模型部署还通过自动计分管道实现流水线化,该流水线包括生产中运行模型需要的所有内容
可信任的AI结果
为了大规模的采用AI模型,业务团队和监管部门必须能够解释和信任AI结果。H2O DriveLess AI 提供高精度模型的同时也提供理解和共享模型结果的关键能力,包括机器学习可解释性(MLI)仪表盘,自动模型文档和为服务代表及客户提供的原因代码(reason code)。
H2O DriveLess AI的主要功能
AutoVis-大数据的探索性数据分析
H2O DriveLess AI 基于最相关统计数据自动选择数据视图来帮助用户在模型构建之前理解他们的数据。这对于理解超大数据集的组合及发现数据变化趋势和可能的问题(如大量数据值的丢失或可能影响建模结果的显著异常值)非常有用。

自动特征工程与模型构建
特征工程是高级数据科学家用来从算法中提取最准确结果的秘密武器。H2O DriveLess AI 采用算法库和特征转换为给定数据集自动设计新的、高价值的特征。界面中包含一个易读的变量重要性图表,它显示了原始值和新设计的特征值的重要性。
机器学习可解释性(MLI)
H2O Driverless AI 提供可靠的机器学习技术和结果,包括自动生成的K-LIME,Shapley,变量重要性,决策树和部分依赖性图表。每个图表都有助于更密切地探索建模技术和结果。这些技术对那些必须向业务利益相关者和监管机构解释其模型的人至关重要。

自动原因代码
对于许多受监管的行业,需要对与客户相关的重大决策进行解释,例如拒绝信用贷款。原因代码用简单的语言显示模型评分决策中的关键的正面和负面因素。原因代码在其他设置中也很有用,例如医疗保健,因为它们可以提供对模型决策的洞察力,从而可以驱动额外的测试或调查。
自动模型文档(Auto Doc)
为了向业务用户和监管机构解释模型,数据科学家和数据工程师必须记录用于创建机器学习模型的数据,算法和过程。Driverless AI自动模型文档使用户免于在构建机器学习模型时记录和总结其工作流程的耗时任务。该文档包括所用到的数据,所选验证模式,模型和特征调整以及创建的最终模型的详细信息。借助Driverless AI中的这种功能,从业者可以更专注于从模型中获取可操作的洞察力,并在开发,验证和部署过程中节省数周甚至数月的时间。
自动评分(为模型打分)管道
H2O Driverless AI 自动创建Python评分管道和新的超低延迟自动评分管道。新建的自动评分管道是一种单独的技术,它用来部署特征工程和获取最优的机器学习模型,或者它也可以集成在一个高度优化的,低延迟的生产就绪JAVA管道中,该管道可以部署在任何地方。这种技术对于运行模型的企业来说至关重要,这些模型需要在一系列设备上运行的实时应用程序上进行超快评分。
时序谱
时间序列预测是数据科学家面临的最大挑战之一。时间序列模型针对关键用例,包括需求预测,基础架构监控和基于事务,日志和传感器数据的预测性维护。 H2O DriveLess AI提供卓越的时间序列功能,可优化几乎任何预测时间窗口,整合来自众多预测变量的数据,处理结构化字符数据和高基数分类变量,并处理时间序列数据和其他缺失值的差距。
企业数据访问和安全
为企业部署启用AI需要数据访问,可伸缩性和安全性。Driverless AI 支持企业数据访问,通过连接器访问内部和云数据源,这些云数据源包括AWS、Google Cloud、Azure和Sowflake 。Driverless AI支持基于CPU和GPU的系统,包括NVIDIA和IBM Power的最新系统。对于用户身份验证,Driverless AI支持LDAP和Kerberos以提供安全访问
企业支持与培训
H2O.ai以提供卓越的客户服务和支持而闻名。在2018年数据科学和机器学习平台Gartner魔力象限(Gartner魔力象限是监测和评估专业科技市场中公司的发展及定位的一种研究方法论和形象化工具)中,H2O.ai获得了客户服务和支持的最高分。 H2O.ai企业支持服务包括:7×24小时专家电子邮件和电话支持;H2O数据科学访问入口,MLI和算法专家服务;健康检查,运维 /产品咨询;在线和现场培训服务。
H2O Driverless AI的更多相关文章
- XAI/MLI 可解释机器学习系列1- 开源&paper汇总
一直在关注可解释机器学习领域,因为确实在工作中有许多应用 模型检查,特征重要性是否符合预期和AUC一样重要 模型解释,比起虚无缥缈的模型指标,解释模型学到的规律更能说服业务方 样本解释,为什么这些用户 ...
- 媲美pandas的数据分析工具包Datatable
1 前言 data.table 是 R 中一个非常通用和高性能的包,使用简单.方便而且速度快,在 R 语言社区非常受欢迎,每个月的下载量超过 40 万,有近 650 个 CRAN 和 Biocondu ...
- H2O.ai初步使用
1.官网下载最新稳定版,https://www.h2o.ai/download/ ,如果点击下载无反应,请使用ie浏览器 2.解压h2o-3.18.0.10.zip到目录h2o-3.18.0.10 3 ...
- AI - H2O - 第一个示例
1 - Iris数据集 Iris数据集是常用的机器学习分类实验数据集,特点是数据量很小,可以快速学习. 数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性. Sepal.Leng ...
- [GPU] Install H2O.ai
一.前言 主页:https://www.h2o.ai/products/h2o4gpu/ GPU版本安装:h2oai/h2o4gpu 采用GPU,能否成为超越下面链接中实验的存在? [ML] LIBS ...
- AI - H2O - 安装与运行
安装的要求 H2O的安装对操作系统.编程语言和浏览器有具体的要求. 详情请查看官方信息 下载H2O Downloading & Installing H2O Download 示例 - 在Ce ...
- 源码安装H2O Http 服务端程序到Ubuntu服务器
首先安装全家桶 apt install -y build-essential zlib1g-dev libpcre3 libpcre3-dev unzip cmake libncurses5-dev ...
- ACCA AI来袭会议笔记
ACCA AI来袭会议笔记 Technology in Accounting 调研报告: http://cn.accaglobal.com/news/professional_report.html ...
- AI佳作解读系列(三)——深度学习中的合成数据研究
Below are some investigation resources for synthetic datasets: 1. Synthetic datasets vs. real images ...
随机推荐
- 信息: Error parsing HTTP request header Note: further occurrences of HTTP header parsing errors will be logged at DEBUG level
四月 , :: 下午 org.apache.coyote.http11.AbstractHttp11Processor process 信息: Error parsing HTTP request h ...
- 用javascript编写地区表单ES6
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
- LINUX升级PHP版本至5.4.26
参考网址:http://www.itbulu.com/wdcp-php54.html文件:链接:http://pan.baidu.com/s/1slbbNxr 密码:s0yb 1.运行下载PHP版本文 ...
- 树概念及使用connect by进行级联查询
树 树,大家都见过,以这种形式的数据关系,就是树.下面看一张图,了解什么是根节点(树干).节点或分叉.叶(叶节点) connect by 级联查询 connect by可以用于级联查询,常用于对具有树 ...
- JSON定义及应用
1 什么是JSON? JSON 指的是 JavaScript 对象表示法(JavaScript Object Notation) 是轻量级的文本数据交换格式,JSON 比 XML 更小.更快,更易解析 ...
- vue组件中,iview的modal组件爬坑--modal的显示与否应该是使用v-show
这是我第一次写博客,主要是记录下自己解决问题的过程和知识的总结,如有不对的地方欢迎指出来! 需求:点击btn,弹出modal显示图表(以折现图为例) 这应该是很基本的需求也是很容易实现的,代码和效果如 ...
- Z字形编排问题详解(C++)
Z字形编排问题详解(C++): 问题描述:给定一个矩阵matrix,输出矩阵matrix进行Z字形编排后的内容. 原矩阵: 输出形式: 算法分析与详细解答: 要解决这样一个问题,可能一开始无从下手,但 ...
- Nginx与Tomcat实现请求动态数据与请求静态资源的分离
上篇博客说明了Nginx在应用架构中的作用,以及负载均衡的思路.这篇实践一下其中的访问静态资源与访问动态资源的操作. 一.认识访问静态资源与访问动态资源的区别 静态资源:指存储在硬盘内的数据,固定的数 ...
- jQuery属性操作之.attr()
目录 .attr() 调用形式:$("xxx").attr(name) 调用形式:$("xxx").attr(name,value); 调用形式:$(" ...
- Redis 之持久化
目录 一.前言 二.持久化类型之 RDB 三.持节化类型之AOF 四.Redis 持久化类型的抉择 五.持久化的恢复 六.持久化问题的分析定位与优化 七.回顾总结 一.前言 首先,来回顾下前面文章的知 ...