【奥鹏】-[南开大学]《大数据开发技术(一)》19秋期末考核
试卷总分:100 得分:100
第1题,UMP系通过()来实现实现数据路由的基本功能
A、Controller服务器
B、Procy服务器
C、愚公系统
D、Agent服务器
正确答案:
第2题,Amazon Redshift属于()
A、关系数据库
B、键值数据库
C、NoSQL数据库
D、数据仓库
正确答案:
第3题,应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()
A、列族数据库
B、键值数据库
C、图数据库
D、文档数据库
正确答案:
第4题,HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
A、Master
B、Region
C、Zookeeper
D、Chubby
正确答案:
第5题,UMP系统中面对中等规模用户如何进行资源调度()
A、可以共享同一个MySQL实例
B、每个用户独占一个MySQL实例
C、会占用多个独立的MySQL实例
D、随机分配MySQL实例
正确答案:
第6题,以下亚马逊的产品中哪个是数据仓库
A、ElastiCache
B、RDS
C、DynamoDB
D、Redshift
正确答案:
第7题,UMP系统中面对多个小规模用户如何进行资源调度()
A、可以共享同一个MySQL实例
B、每个用户独占一个MySQL实例
C、会占用多个独立的MySQL实例
D、随机分配MySQL实例
正确答案:
第8题,关于Strom中Bolt说法错误的是()。
A、Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作
B、Bolt是一个被动的角色,Spout是一个主动的角色
C、Bolt不仅可以处理Tuple还可以创建新的Tuple
D、Bolt是Streams的状态转换过程的抽象含义
正确答案:
第9题,优点是查找速度快,可扩展性强,容易进行分布式扩展,复杂性低的数据库是()
A、列族数据库
B、键值数据库
C、图数据库
D、文档数据库
正确答案:
第10题,应用于分布式数据存储与管理
数据在地理上分布于多个数据中心的应用程序的数据库是哪种()
A、列族数据库
B、键值数据库
C、图数据库
D、文档数据库
正确答案:
第11题,Hbase中客户端包含访问HBase的接口,同时在缓存中维护着已经访问过的()位置信息,用来加快后续数据访问过程
A、Master
B、Slaver
C、Region
D、客户端
正确答案:
第12题,以下亚马逊的产品中哪个是分布式内存缓存
A、ElastiCache
B、RDS
C、DynamoDB
D、Redshift
正确答案:
第13题,Hbase采用()作为底层数据存储
A、HDFS
B、GFS
C、Hbase
D、传统文件系统
正确答案:
第14题,关于Hadoop集群,以下说法错误的是()。
A、SecondaryNameNode可以和NameNode共用一台机器
B、JobTracker指派的任务由TaskTracker执行
C、SecondaryNameNode可以和DataNode共用一台机器
D、NameNode可以和JobTracker共用一台机器
正确答案:
第15题,Map Task和Reduce Task均由()启动。
A、Client
B、Job Tracker
C、Task
D、Task Tracker
正确答案:
第16题,HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。
A、FsImage
B、DataNode
C、Block
D、EditLog
正确答案:,D
第17题,以下图计算软件哪种属于以图顶点为中心的、基于消息传递批处理的并行引擎
A、Giraph
B、Pregel
C、Hama
D、DEX
正确答案:,B,C
第18题,以下哪种数据库属于NoSQL数据库()
A、MySQL
B、DynamoDB
C、InfiniteGraph
D、MongoDB
正确答案:,C,D
第19题,关系数据库与NoSQL数据库相比适用于哪些领域()
A、电信
B、银行
C、互联网企业大数据处理
D、传统企业的数据分析
正确答案:,B
第20题,以下哪种数据库是针对在线业务的,并且抛弃了关系模型()
A、MongoDB
B、MySQL
C、Oracle
D、Redis
正确答案:,D
第21题,分布式文件系统的设计目的包括()。
A、并发控制
B、可伸缩性
C、容错
D、速度
正确答案:,B,C
第22题,MapReduce的main函数中设置输出类型的方法有()。
A、setOutputKeyClass
B、setOutputClass
C、setOutputValueClass
D、setKeyValueClass
正确答案:,C
第23题,以下哪些是云计算关键技术()。
A、虚拟化
B、分布式计算
C、分布式存储
D、物联网
E、单租户
正确答案:,B,C
第24题,Pregel作为分布式图计算的计算框架,主要用于()
A、图遍历
B、最短路径
C、PageRank计算
D、MapReduce
正确答案:,B,C
第25题,以下哪个应用适合用Pregel来解决()
A、数据库的笛卡尔积
B、单元最短路径
C、二分匹配
D、求极值
正确答案:,C
第26题,分布式离线分析可以实现秒级别的实时分析响应。
T、对
F、错
正确答案:F
第27题,Hadoop平台在大数据发展的成熟期时开始大行其道
T、对
F、错
正确答案:T
第28题,Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储
T、对
F、错
正确答案:F
第29题,在HBase 的概念视图中, 一个表可以视为一个稀疏、多维的映射关系。
T、对
F、错
正确答案:T
第30题,HBase中包含一个Region服务器和许多个Master服务器
T、对
F、错
正确答案:F
第31题,HDFS读数据过程中读取请求获得的输入流是FSInputStream
T、对
F、错
正确答案:F
第32题,Linux系统中只有Ubuntu可以安装Hadoop。
T、对
F、错
正确答案:F
第33题,MapReduce处理分组聚合操作时,在Map过程中,选择关系的某一宇段的值作为键,其他字段的值作为与键相关联的值;Reduce过程,输出为键,聚合运算结果〉。
T、对
F、错
正确答案:T
第34题,Hbase和传统数据库一样都是列式数据库
T、对
F、错
正确答案:F
第35题,在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在
T、对
F、错
正确答案:F
第36题,MapReduce的main函数中添加MyMapper类的方法为job.##(MyMapper.class);
正确答案:
第37题,Storm运行任务的方式与Hadoop类似:Hadoop运行的是MapReduce作业,而Storm运行的是##
正确答案:
第38题,HDFS中SecondaryNameNode通过HTTP的##请求方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下;
正确答案:
第39题,SQL中的table对应与MongoDB中的##
正确答案:
第40题,所有的HDFS通信协议都是构建在##协议基础之上的
正确答案:
第41题,Hbase中Master的主要工作
正确答案:
第42题,试说明一个MapReduce程序在运行期间,所启动的Map任务数量和Reduce任务数量各是由什么因素决定的。
正确答案:
第43题,Twitter Storm
正确答案:
第44题,Hbase中.META.表
正确答案:
第45题,数据库事务的原子性
正确答案:
第46题,Hadoop项目中的Pig
正确答案: