CDP 平台简介
简介: EDC 建立在 Cloudera Data Platform(CDP) 之上,该产品结合了 Cloudera Enterprise Data Hub 和 Hortonworks Data Platform Enterprise 的优点,并在技术堆栈中增加了新功能和对已有技术提供了增强功能。这种统一的发行是一个可扩展且可自定义的平台,您可以在其中安全地运行多种类型的工作负载。
企业数据云概述
企业对大数据解决方案的要求:只要有必要,就可以在一个地方以原始的保真度来获取和合并任何数量或类型的数据,并尽可能快地向所有用户提供洞察力。
企业数据云公司 Cloudera 引入了企业数据云(EDC)的概念:数据驱动的企业需要能够对无处不在的数据应用多种分析规则;能够以流式的方式传输和处理来自边缘多个端点的实时数据,同时预测关键结果并在同一数据集上应用机器学习技术;能够充分利用公有云基础架构的敏捷性、灵活性以及日益庞大的数据引力;此外,能够在开放平台上完成所有这些工作,在数据存放和分析运行的所有位置都能应用数据安全和治理。这就是业界所说的企业数据云。
EDC 具有以下特点:
- 混合云和多云支持:提供选择来管理、分析和试验任何公有云和私有数据中心中的数据,以实现最大的选择和灵活性。
- 多功能分析:解决最苛刻的业务用例 – 跨共享数据大规模地应用实时流处理、数据仓库、数据科学和迭代机器学习。
- 安全性和治理:通过通用的安全模型来控制任何云(公有云、私有云和混合云)上的数据,简化了各种企业数据的数据隐私和合规性。
- 开放:促进开源社区的创新、提供开放存储和计算架构的选择性以及促进广泛的生态系统的信心和灵活性
企业数据云平台不但提供企业级的安全性和治理能力,还同时提供多种分析功能用于数据分析,具备在内部和外部部署相同功能的能力,支持主要的公有云和私有云环境、使得用户获得弹性的云体验,并不再存在数据孤岛和单一供应商锁定的威胁。
EDC 不但可以灵活地运行各种企业工作负载(例如:实时摄取和分析、数据工程、交互式 SQL、企业搜索、高级分析和机器学习),还满足企业的要求:与企业现有的系统进行集成,同时提供强大的安全性、数据治理、数据保护和管理能力。EDC 是企业数据管理的新兴中心。
CDP平台简介
EDC 建立在 Cloudera Data Platform(CDP) 之上,CDP 是 Cloudera 公司的最新产品,该新产品结合了 Cloudera Enterprise Data Hub 和 Hortonworks Data Platform Enterprise 的优点,并在技术堆栈中增加了新功能和对已有技术提供了增强功能。这种统一的发行是一个可扩展且可自定义的平台,您可以在其中安全地运行多种类型的工作负载。
除了需要企业数据云外,企业还希望将这种强大的数据管理基础架构迁移或添加到云中,以提高运营效率、降低成本、提供计算和容量灵活性以及速度和敏捷性。
随着组织在云环境中采用基于 Hadoop 的大数据部署,他们还需要企业级的安全性和治理、多种分析功能、管理工具和技术支持-所有这些需求都是 CDP 平台的一部分,下图展示了 CDP 平台的功能地图。
CDP 支持各种混合解决方案,其中计算任务与数据存储分离,并且可以从远程集群访问数据。这种混合方法通过管理存储、表 Schema、身份验证、授权和治理,并为容器化应用程序提供了基础。
CDP 包括各种组件,例如 Apache HDFS、Apache Hive 3、Apache HBase 和 Apache Impala,以及许多其他用于特殊工作负载的组件。您可以选择这些服务的任意组合来创建满足您的业务需求和工作负载的集群。几个预配置的服务包也可用于常见的工作负载。
Cloudera Manager 概览
Cloudera Manager 是用于管理、配置和监控 CDP 集群和 Cloudera Runtime 服务的应用程序。
Cloudera Manager 服务器在CDP部署中的主机上运行,并使用在集群中每个主机上运行的 Cloudera Manager 代理来管理一个或多个集群。
Cloudera Manager 是用于管理集群的端到端应用程序。借助 Cloudera Manager,您可以轻松地部署和集中操作完整的 Cloudera Runtime 堆栈和其他托管服务。该应用程序可自动执行安装和升级过程,并为您提供主机和正在运行的服务的整个群集的实时视图。Cloudera Manager 管理控制台提供了一个中央控制台,您可以在其中对整个集群进行配
置更改,并结合了各种报告和诊断工具来帮助您优化性能和利用率。Cloudera Manager还管理安全性和加密功能。使用 Cloudera Manager 管理控制台,您可以启动和停止集群以及单个服务、配置和添加新服务、管理安全性以及升级集群。您还可以使用 Cloudera Manager API 以编程方式执行管理任务。
Cloudera Manager 的单个实例可以管理多个集群,包括较旧版本的 Cloudera Runtime 和 CDH。
Cloudera Runtime
Cloudera Runtime 是 CDP Private Cloud Base 中的核心开源软件发行版。Cloudera Runtime 包括大约50个开源项目,这些项目构成 CDP 中数据管理工具的核心分发。该库中记录了 Cloudera Runtime 组件。
工具
CDP 还包括以下工具来管理和保护您的部署:
- Cloudera Manager 允许您使用 Cloudera Manager 管理控制台的 Web 应用程序或Cloudera Manager API 管理、监控和配置集群和服务。
- Apache Atlas 提供了一组元数据管理和治理服务,使您能够管理 CDP 集群资产。
- Apache Ranger 通过用户界面管理访问控制,以确保 CDP 集群中一致的策略管理。
原文链接
本文为阿里云原创内容,未经允许不得转载。
CDP 平台简介的更多相关文章
- 云计算平台简介(App Engine)
云计算平台简介(App Engine) 1 简介 App Engine: 应用程序引擎,是托管网络应用程序的云计算平台. 1.1 什么是云 云计算通常简称为“云”,是一种通过 Inter ...
- 【RPA Starter第二课】Introduction to the UiPath Enterprise Platform UiPath企业平台简介
Introduction to the UiPath Enterprise Platform UiPath 企业平台简介 课程目标: 了解UiPath实现RPA的步骤 描述每个UiPath解决方案的关 ...
- Ninja Blocks物联网平台简介
Ninja Blocks是一个物联网控制平台,其平台架构包括硬件层.处理器层.软件层以及平台层,请看下图: 最底层是硬件层,包括传感器(Sensors)和驱动器(Actuators),例如温度传感器. ...
- SmartThings物联网平台简介
SmartThings是一个智能设备控制系统,它包括:SmartThings Cloud(云平台).SmartThings Hub(网关).SmartThings Mobile(手机客户端)以及各种关 ...
- 4412开发板Android教程——Android平台简介
本文转自迅为开发板论坛:http://www.topeetboard.com Android和IOS Android的历史 Android公司 2005年Google收购成立22个月的Android公 ...
- UCML 2.0 For ASP.NET开发平台简介
互联网时代,我们能跟上网络变革的步伐吗?我们的产品领先于竞争对手吗?我们能够满足日益个性化的客户需求吗? 采用新的软件开发方法是我们的首要选择. 第一个全面支持ASP.NET的应用框架开发平台诞生了— ...
- AutoMagic自动化测试平台简介
PS:给想做自动化平台同学一点思路. AutoMagic 是一个基于WebUI的自动化管理平台.为什么叫AutoMagic呢?因为自动化(Automation)在执行起来的时候是一个很神奇的事情,它可 ...
- [转]Windows Azure平台简介(一):定位与产品结构
本文转自:http://blog.csdn.net/azurechina/article/details/5592236 http://blogs.msdn.com/b/azchina/archive ...
- Git学习总结(3)——代码托管平台简介
可以说GitHub的出现完全颠覆了以往大家对代码托管网站的认识.GitHub不但是一个代码托管网站,更是一个程序员的SNS社区.GitHub真正迷人的是它的创新能力与Geek精神,这些都是无法模仿的. ...
- .NET平台简介
前言: 看到一个名词:搜商(SQ),还挺有趣.讲的是在互联网时代,怎么能够快速找到自己所需信息或资源,成为一种能力,并将其提升到类似智商.情商的概念.在以后工作过程中,尽量提高自己获取.辨别.处理信息 ...
随机推荐
- C# 12 拦截器 Interceptors
拦截器Interceptors是一种可以在编译时以声明方式替换原有应用的方法. 这种替换是通过让Interceptors声明它拦截的调用的源位置来实现的. 您可以使用拦截器作为源生成器的一部分进行修改 ...
- 记录-JS 基础知识大全
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 1.通过javascript向文档中输出文本 document是javascript的内置对象,代表浏览器的文档部分 document.w ...
- Navicat 连接MySQL 8.0.11 出现2059错误 解决
原因 mysql8 之前的版本中加密规则是mysql_native_password,而在mysql8之后,加密规则是caching_sha2_password 解决 mysql -uroot -pp ...
- SpringBoot RestTemplate 上传文件
@Test public void testUpload() throws Exception { String url = "http://127.0.0.1/file/upload&qu ...
- KingbaseES sys_bulkload数据加载工具错误处理
一.关于sys_bulkload数据加载工具 sys_bulkload是KingbaseES提供的快速加载数据的命令行工具.用户使用sys_bulkload工具能够把一定格式的文本数据简单.快速的加载 ...
- 基于UDP的服务器端/客户端
基于UDP的数据I/O函数 //成功时返回传入的字节数,失败时返回-1 ssize_t sendto (int __fd, const void *__buf, size_t __n, int __f ...
- C# 发布你的程序包到Nuget
1.新建一个.NET Standard 的类库项目 2.选择项目属性,在 package 栏目下填写我们的nuget包信息 3.选择我们的项目,点击"Pack" 打包 主要注意的是 ...
- RabbitMQ 02 安装
安装 推荐使用Docker进行安装. 执行如下命令. docker run -d --restart always --name rabbitmq \ -e RABBITMQ_DEFAULT_USER ...
- Linux程序崩溃自启动方法
linux进程挂掉后,可以通过配置 systemd 来自动启动服务 1.创建 systemd 服务文件,例如:huyang.service,需要放置在系统文件夹 /etc/systemd/system ...
- jenkins安装卸载和下载
环境 :docker容器 卸载 jenkins 1.rpm卸载rpm -e jenkins 2.检查是否卸载成功rpm -ql jenkins 3.彻底删除残留文件:find / -iname jen ...