大数据初级sy
1.spark 是用以下哪种编程语言实现的?
A.C B C++ C JAVA D.Scala (正确答案)
2.FusionInsight Manager 对服务的管理操作,下列说法错误的是?
A.可对服务进行起停重启操作 B.可以添加和卸载服务 C可设置不常用的服务隐藏或提示(正确答案) D 可查看服务的当前状态
3.FusionInsight HD 集群升级,以下描述正确的有?(多选)
A 升级过程中不可以手工操作主备 OMS倒换(正确答案)
B 集群内所有主机的root账户密码要保持一致(正确答案)
C 保持网络畅通,避免因网络问题导致升级异常(正确答案)
D观察期不能做扩容(正确答案)
4.fusioninsight HD 的loader在创建作业时,连接器(connector)有什么作用?
A.确定有哪些转换步骤
B.提供优化参数,提高数据导入导出性能
C配置作业如何与外部数据源进行连接(正确答案)
D配置作业如何与内部数据源进行连接
5.下列哪个HDFS命令可用于检测数据块的完整性?
A.hdfs fsck /(正确答案)
B.hdfs fsck / -delete
C.hdfs dfsadmin -report
D.hdfs balancer-threshold 1
6.YARN中设置队列QueueA的最大使用资源量,需要配置哪个参数?
A.yarn scheduler capacity root QueueA user-limit-factor
B.yarn scheduler capacity root QueueA minimum-user-limit-percent
C.yarn scheduler capacity root QueueA state
D.yarn scheduler capacity root QueueA maximum-capacity(正确定位)
7.Flume的数据流可以根据header 的信息发送到不同的channel中.
A.正确 (正确答案) B,错误
8.Fusioninsight Manager 与外部管理平台对接时,支持哪些接口?(多选)
A.SNMP (正确答案)
B.VPN
C.BGP
D.Syslog(正确答案)
9.Hbase的数据文件HFile中的一个KeyValue格式包含哪些信息?(多选)
A.Key (正确答案)
B.Value(正确答案)
C.TimeStamp(正确答案)
D.Key Type(正确答案)
10.FusionInsight HG集群规划设计时,集群有150个节点,并且采用双平面组网部署,对于该集群网络带宽要求的描述,下列描述正确的有?(多选)
A.业务平面所有节点都使用10GE网络(正确答案)
B,管理平面中控制节点使用10GE网络
C.管理平面中数据节点使用10GE网络(正确答案)
D.管理平面中控制节点使用10GE网络
E.管理平面中管理节点使用10GE网络(正确答案)
11.FusionInsight系统中Hive支持的存储格式包括?(多选)
A.HFile
B.TextFile(正确答案)
C.SequenceFile(正确答案)
D.RCFile(正确答案).
12.Spark任务的每个stage可划分为job,划分的标记是shuffle.
A.正确 B.错误(正确答案)
13.FusionInsight Manager 对服务的配置功能说法不正确的是?
A.服务级别的配置可对所有实例生效
B.实例级别的配置只针对本实例生效
C.实例级别的配置对其它实例也生效(正确答案)
D.配置保存后需要重启服务才生效
14.FusionInsight HD部署Solr时,如果选择索引存放在本地磁盘,建议给每个SolrServer实例的数据目录单独挂载磁盘,并且磁盘为RAID0或RAID5.
A.对(正确答案) B.错
15.关于FusionInsight HD安装流程正确的是?
A.安装Manager--执行preinstall--LLD工具进行配置---安装集群--安装后检查--安装后配置
B.LLD工具进行配置--执行reinstall--安装Manager--安装集群--安装后检查--安装后配置(正确答案)
C.安装Manager--LLD工具进行配置--执行preinstall--安装集群--安装后检查--安装后配置
D.LLD工具进行配置--执行preinstall--安装集群--安装Manager--安装后检查--安装后配置
16.关于Kerberos部署,描述正确的是?
A.Kerberos仅有一个角色
B.Kerberos服务在同一个节点上有两个实例(正确答案)
C.Kerberos服务采用主备模式部署
D.Kerberos服务必须和LDAP服务部署在同一个节点上
17.某银行规划的FusionInsight HD集群有90个节点,如果控制节点规划了3个,那集群中数据节点推荐规划多少最为合理?
A.87(正确答案)
B.85
C.90
D.86
18.安装FusionInsight HD软件包前,必须在本节点/etc/hosts文件中配置集群所有节点的主机名称与业务IP的映射关系.
A.正确(正确答案) B.错误
19.客户IT系统中FusionInsight HD集群有150个节点,每个节点12块磁盘(不做RAID,不包括OS盘),每个磁盘大小1T,只安装HDFS,按照默认配置最大可存储多少数据?
A.1764TB
B.1800TB
C.600TB
D,500TB(正确答案)
20.FusionInsight HD节点不支持哪种主机操作系统?
A.Suse
B.RedHat 6.5
C.CentOS 6.4
D.Ubuntu 11.0.4(正确答案)
21.FusionInsight HD中,如果需要检查当前登录HBase的用户和权限组,可以在HBase shell中执行什么命令?
A.use_permission
B.whoami(正确答案)
C.who
D.get_user
22.FusionInsight HD产品在部署Kerberos和LDAP服务时,一下描述正确的是?(多选)
A.部署Kerberos服务之前,必须先部署LDAP服务(正确答案)
B.LDAP服务必须和Kerberos服务部署在同一个节点
C.Kerberos服务和LDAP服务部署到同一个节点利于数据访问,有助于性能提升(正确答案)
D.LDAP服务可以多个集群共享
23.FusionInsight HD Manager界面Hive日志收集,哪个选项不正确?
A.可指定实例进行日志收集,比如指定单独收集MetaStore的日志
B.可指定时间段进行日志收集,比如只收集2016-1-1到2016-1-10的日志
C.可指定节点IP进行日志收集,例如仅下载某个ip的日志
D.可指定特定用户进行日志收集,例如仅下载userA用户产生的日志(正确答案)
24.华为FusionInsight HD集群中,Spark 服务可以从以下哪些服务读取数据?(多选)
A.YARN
B.HDFS(正确答案)
C.Hive(正确答案)
D.HBase(正确答案)
25.如果YARN集群中只有Default ,QueueA和QueueB子队列时,那么允许讲他们的容量分别设置为60%,25%和22%.
A.正确 B.错误(正确答案)
26.FusionInsight HD系统中,关于Solr索引的存储部署策略,一下说法正确的有?(多选)
A.利用HDFS数据存储可靠性和易于扩容的特点优先选择索引存储于HDFS.(正确答案)
B.不论Solr索引存储在HDFS上还是存储在本地磁盘,在同一个节点上都必须要部署5个Solr实例,根据
C.当对实时索引录入速度要求较高时,可选择索引存放于本地磁盘.(正确答案)
D.当索引数据存放在HDFS上时,SolrServer实例与DataNode实例部署在同一个节点上.(正确答案)
27.FusionInsight HD三层组网适合多少节点的集群规模?
A.30节点一下7
B,100节点以上
C.100~200节点
D.200节点以上(正确答案)
28.FusionInsight HD系统中,Kerberos仅用于组件间服务安全认证.
A.正确
B.错误(正确答案)
大数据初级sy的更多相关文章
- 大数据初级笔记二:Hadoop入门之Hadoop集群搭建
Hadoop集群搭建 把环境全部准备好,包括编程环境. JDK安装 版本要求: 强烈建议使用64位的JDK版本,这样的优势在于JVM的能够访问到的最大内存就不受限制,基于后期可能会学习到Spark技术 ...
- 【SQL server初级】数据库性能优化一:数据库自身优化(大数据量)
数据库优化包含以下三部分,数据库自身的优化,数据库表优化,程序操作优化.此文为第一部分 数据库性能优化一:数据库自身优化 优化①:增加次数据文件,设置文件自动增长(粗略数据分区) 1.1:增加次数据文 ...
- Spark大数据的学习历程
Spark主要的编程语言是Scala,选择Scala是因为它的简洁性(Scala可以很方便在交互式下使用)和性能(JVM上的静态强类型语言).Spark支持Java编程,但对于使用Java就没有了Sp ...
- Hadoop! | 大数据百科 | 数据观 | 中国大数据产业观察_大数据门户
你正在使用过时的浏览器,Amaze UI 暂不支持. 请 升级浏览器 以获得更好的体验! 深度好文丨读完此文,就知道Hadoop了! 来源:BiThink 时间:2016-04-12 15:1 ...
- 大数据公益课堂成就你高薪之梦,30W,50W,100W...
从之前的知道“大数据”这词,到2013年正式开始了解大数据领域,再到2014年深入研究大数据相关的领域,到现在逐渐影响周围的同学.朋友和家人.大数据技术将给我们带来的远不止我们想到的这些.曾经我身边的 ...
- 开源分布式计算引擎 & 开源搜索引擎 Iveely 0.5.0 为大数据而生
Iveely Computing 产生背景 08年的时候,我开始接触搜索引擎,当时遇到的第一个难题就是大数据实时并发处理,当时实验室的机器我们可以随便用,至少二三十台机器,可以,却没有程序可以将这些机 ...
- [Hadoop 周边] 浅谈大数据(hadoop)和移动开发(Android、IOS)开发前景【转】
原文链接:http://www.d1net.com/bigdata/news/345893.html 先简单的做个自我介绍,我是云6期的,黑马相比其它培训机构的好偶就不在这里说,想比大家都比我清楚: ...
- 大数据与可靠性会碰撞出什么样的Spark?
可靠性工程领域的可靠性评估,可靠性仿真计算,健康检测与预管理(PHM)技术,可靠性试验,都需要大规模数据来进行支撑才能产生好的效果,以往这些数据都是不全并且收集困难,而随着互联网+的大数据时代的来临, ...
- bat坐拥大数据。数据挖掘/大数据给他们带来什么。
阿里巴巴CTO即阿里云负责人王坚博士说过一句话:云计算和大数据,你们都理解错了. 实际上,对于大数据究竟是什么业界并无共识.大数据并不是什么新鲜事物.信息革命带来的除了信息的更高效地生产.流通和消 ...
随机推荐
- redis 未授权访问(写公钥、写计划任务)
写公钥 ssh-keygen -t rsa # 生成key (echo -e "\n\n"; cat id_rsa.pub; echo -e "\n\n") & ...
- vue常见错误
错误集锦 错误一 错误二 原因是写太多的import,修改呈如下方式 错误三 源码如下 原因是没有在return后面添加值 应该为 return false
- [刷题] 17 Letter Combinations of a Phone Number
要求 给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合 1 不对应任何字母 示例 输入:"23" 输出:["ad", "ae&q ...
- 【打印机】无法连接 fail to connect to server cups 服务器错误 打印机
打印机 fail to connect to server cups 服务器错误兆芯 打印机 连不上了####message可知 服务fail## systemd: cups.servi ...
- Zabbix 自定义report
#!/bin/bash . /etc/profile logdir='/home/admin/zabbix/zabbix_log' mysql_host='localhost' mysql_user= ...
- cat ~/.bash_history
7.history命令 history命令用于显示历史执行过的命令,格式为"history [-c]". history命令应该是作者最喜欢的命令.执行history命令能显示出当 ...
- openstack创建vlan网络并配置网络设备
1.在管理员-->网络-->创建网络. 2.填写网络信息,这里要划分新的VLAN,注意在物理网络中填写的事VLAN,段ID指的是vlan的id 3.创建的网络. 4.创建子网,在里面修改子 ...
- ZooKeeper IDEA 可视化管理插件安装
1. 安装 zookeeper 插件 打开 IDEA->Settings->Plugins,然后在 Marketplace 输入 "zookeeper" 如下: 插件安 ...
- MySQL8 配置远程连接
引言 MySQL8 默认安装后只有本机能访问,如果需要远程连接 MySQL 将无法访问 查看 root 用户权限 进入 mysql 表 select user,host,plugin from use ...
- DOCKER学习_013:Dockerfile配置指令ENTRYPOINT详解
前面已经介绍了一些Dockerfile的一些指令,对于ENTRYPOINT和CMD也有介绍实验 一 ENTRYPOINT和CMD配置使用 ENTRYPOINT相当于CMD,是配置容器后的一个指令,但是 ...