[转]CDH QuickStart VM基本使用
https://blog.csdn.net/wiborgite/article/details/78731944
https://www.cnblogs.com/harrychinese/p/big_data_platform_quickstart.html
https://www.lookfor404.com/cloudera-quickstart-vm-%E9%9B%86%E6%88%90%E4%BA%86%E5%A4%A7%E6%95%B0%E6%8D%AE%E5%B9%B3%E5%8F%B0%E7%9A%84%E8%99%9A%E6%8B%9F%E6%9C%BA%E9%95%9C%E5%83%8F/
CDH 和 Cloudera Manager 是什么
CDH (Cloudera's Distribution, including Apache Hadoop), 是Cloudera发行的Hadoop发行版, 基于Hadoop稳定版, 并集成了许多补丁, 可以直接在生产环境中使用.
Cloudera Manager 是 Cloudera 推出的大数据解决方案, 已经在安装/配置/监控方面做了大量的工作.它不仅包含CDH, 而且集成了很多常用的组件, 比如 HBASE, Hue, Impala, Kudu, Oozie, Kafka, Sentry, Solr, Spark, YARN, ZooKeeper 等, 它分为两个版本Cloudera Express 和 Cloudera Enterprise .
Cloudera Express免费使用, Cloudera Enterprise 需要支付费用. Express版本最高支持50个节点, 而且不限制用到生产环境, Enterprise版包含一些非常高级的功能以及官方支持, 对于普通用户来讲, Express就足够了. http://www.cloudera.com/documentation/enterprise/latest/topics/cm_ig_feature_differences.html
我推荐: Cloudera Express版
前几天和朋友聊天,他告诉我有一个cloudera-quickstart,这是一个集成了大部分大数据组件的虚拟机镜像系统,反正就是–不用配置了,包括hadoop,hbase,hive,hue,spark,zookeeper等等,是cloudera定制的版本,还有cloudera的管理组件。我们只需要把镜像下下来,直接在visualbox或者vmvare里面运行就行。
于是我就自己尝试了一下vmvare的版本,不过出了问题,主要是内存不足。在这里也提醒一下想用quickstart-vm的朋友,你得保证你的电脑至少有8g的内存,配置越高越好,不然会很卡。
下面记录一下自己运行cloudera-quickstart-vm的vmvare版本。
下载地址:http://www.cloudera.com/downloads.html
第一个就是quickstart-vm:
点击download下载。我下载的是vmvare的版本。PS:下载的时候可能会要求你登陆账号,注册一个就好。我得到的下载链接是:https://downloads.cloudera.com/demo_vm/vmware/cloudera-quickstart-vm-5.5.0-0-vmware.zip
整个zip大小4g多,本地用迅雷下载速度也快不到哪里去,于是我用百度网盘离线下载,秒下,然后再从百度云下到本地。
下载完成,解压。
打开vmvare,点击菜单栏上的文件–打开,找到刚才解压的路径,就能发现有一个vmx文件,打开它。
打开之后,vmvare是这样的:
先别急着运行,要先更改虚拟机的配置,你需要把这台虚拟机设置到至少8g内存(这意味着你的电脑需要至少需要8g内存,没有的话,会非常非常卡,而且一堆错误),处理器设置成至少两个。
这时候,可以启动这台虚拟机了。启动之后,它会自动启动火狐浏览器,打开一个初始页面:
怎么进入管理界面呢?
运行桌面的cloudera express命令脚本即可。
如果出现以下错误,说明你的虚拟机没有设置到8g内存和两个处理器,请设置完毕再重新打开这个虚拟机。
想强制启动的话,可以在终端运行以下命令:
sudo /home/cloudera/cloudera-manager --express --force
不出意外的话,启动成功了:
接下来可以去浏览器直接管理了。
打开内置的火狐,输入网址:http://quickstart.cloudera:7180
登录账号:cloudera
登录密码:cloudera
登陆之后,就可以看到管理界面了:
可以看到,左边是整合的大数据工具,点击对应的下拉按钮,就可以启动,关闭,管理这些组件了。
PS:由于电脑内存太小,所以这个整合了所有单机版大数据工具的系统,我用的并不顺手,这里仅把过程记录下来,供大家参考。
PPS:还是乖乖搭环境去了
[转]CDH QuickStart VM基本使用的更多相关文章
- 免安裝、免設定的 Hadoop 開發環境 - cloudera 的 QuickStart VM
cloudera 的 QuickStart VM,為一種免安裝.免設定 Linux 及 Hadoop,已幫你建好 CDH 5.x.Hadoop.Eclipse 的一個虛擬機環境.下載後解壓縮,可直接以 ...
- Hadoop-Impala学习笔记之入门
CDH quickstart vm包含了单节点的全套hadoop服务生态,可从https://www.cloudera.com/downloads/quickstart_vms/5-13.html下载 ...
- 搭建单机CDH环境,并更新spark环境
搭建单机CDH环境,并更新spark环境 1,安装VMWare Player,http://dlsw.baidu.com/sw-search-sp/soft/90/13927/VMware_playe ...
- zhihu spark集群,书籍,论文
spark集群中的节点可以只处理自身独立数据库里的数据,然后汇总吗? 修改 我将spark搭建在两台机器上,其中一台既是master又是slave,另一台是slave,两台机器上均装有独立的mongo ...
- windows eclipse直接访问远程linux hadoop开发环境配置(符合实际开发的做法)
CDH 5.x搭建请参考CentOS 7离线安装CDH 5.16.1完全指南(含各种错误处理). 如果使用的是cloudera quickstart vm,则只能在linux服务器中使用eclipse ...
- hadoop过程中遇到的错误与解决方法
本文整理了在hadoop学习过程中遇到的各种问题. windows下开发环境搭建 大部分情况下,我们都是在windows下开发,hadoop则一般部署于linux服务器(无论是CDH还是原生hadoo ...
- hadoop发行版本
Azure HDInsight Azure HDInsight is Microsoft's distribution of Hadoop. The Azure HDInsight ecosystem ...
- infoq
1. I am Charles Humble and I am here at QCon London with Eva Andreasson from Cloudera. Eva, can you ...
- 从MySQL到Hive,数据迁移就这么简单
使用Sqoop能够极大简化MySQL数据迁移至Hive之流程,并降低Hadoop处理分析任务时的难度. 先决条件:安装并运行有Sqoop与Hive的Hadoop环境.为了加快处理速度,我们还将使用Cl ...
随机推荐
- 关于vue-router 中参数传递的那些坑(params,query)
1.query方式传参和接受参数 传参 this.$router.push({ path:'/xxx' query:{ idname:id } })接收的方式:this.$route.query.id ...
- 在linux服务器上搭建nvidia-docker环境
docker相当于一个容器,其可以根据你所需要的运行环境构建相应的运行环境,此时各个环境之间彼此隔离,就不会存在在需要跑一个新的代码的时候破坏原来跑的代码所需要的环境,各个环境之间彼此隔离开,好像一个 ...
- Android Bundle详解
http://blog.csdn.net/cswhale/article/details/39053411 1 Bundle介绍 Bundle主要用于传递数据:它保存的数据,是以key-value(键 ...
- windows下网络编程UDP
转载 C++ UDP客户端服务器Socket编程 UDPServer.cpp #include<winsock2.h>#include<stdio.h>#include< ...
- [Luogu 4316] 绿豆蛙的归宿
题目链接 一道基础的 \(DAG\) 上期望 \(DP\). 给出一个有向无环图,起点为 \(1\) 终点为 \(N\),每条边都有一个长度,并且从起点出发能够到达所有的点,所有的点也都能够到达终点. ...
- Python包中 __init__.py文件的作用
原创连接 https://www.cnblogs.com/AlwinXu/p/5598543.html Python包中 __init__.py文件的作用 在创建python包的过程中,IDE都会在包 ...
- 【LOJ 6041】「雅礼集训 2017 Day7」事情的相似度
Description 人的一生不仅要靠自我奋斗,还要考虑到历史的行程. 历史的行程可以抽象成一个 01 串,作为一个年纪比较大的人,你希望从历史的行程中获得一些姿势. 你发现在历史的不同时刻,不断的 ...
- 13、Ajax的使用
一.AJAX 是一种在无需重新加载整个网页的情况下,能够更新部分网页的技术. a).AJAX = 异步 JavaScript 和 XML. b).AJAX 是一种用于创建快速动态网页的技术. 通过在后 ...
- linux --xampp 配置多个网站
我们想要在本地安装两个测试域名,www.abc.tld, www.xyz.tld, 分别指向到 htdoc 目录下的 abc.tld 和 xyz.tld 文件夹下.tld 是顶级域名 the top ...
- iTOP-4412/4418/6818开发板-fastboot烧写脚本
在 iTOP-4412,4418,6818 开发板烧写的时候,使用的是 fastboot 工具. fastboot 工具需要在 cmd.exe 中调用,每次都需要输入烧写命令,这样步骤有点多.在程序员 ...