总浏览量:539.52万
南开《大数据导论》19秋期末考核{刘老师满分答案}

时间:2020-03-26 21:00来源:本站作者:点击: 657 次

可做奥鹏院校所有作业、毕业论文咨询请添加 QQ:3082882699
微信:jd958787

【奥鹏】-[南开大学]《大数据导论》19秋期末考核
试卷总分:100    得分:100
第1题,以下不是数据仓库基本特征的是()
A、数据仓库是面向主题的
B、数据仓库是面向事务的
C、数据仓库的数据是相对稳定的
D、数据仓库的数据是反映历史变化的
正确答案:


第2题,()是Microsoft Office的核心组件
A、SQL
B、WORD
C、PPT
D、EXCEL
正确答案:


第3题,数据清洗的方法不包括
A、缺失值处理
B、噪声数据清除
C、一致性检查
D、重复数据记录处理
正确答案:


第4题,数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段(  )。
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
正确答案:


第5题,下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A、ggplot2
B、network
C、ggmaps
D、animation
正确答案:


第6题,下列不属于Google云计算平台技术架构的是()
A、并行数据处理MapReduce
B、分布式锁Chubby
C、结构化数据表BigTable
D、弹性云计算EC2
正确答案:


第7题,大数据的最显著特征是() 。
A、数据规模大
B、数据类型多样
C、数据处理速度快
D、数据价值密度高
正确答案:


第8题,IaaS是()的简称
A、软件即服务
B、平台即服务
C、基础设施即服务
D、硬件即服务
正确答案:


第9题,基础设施即服务的英文简称是
A、IaaS
B、PaaS
C、SaaS
正确答案:


第10题,下列哪个工具常用来开发移动友好地交互地图()
A、Leaflet
B、Visual.ly
C、BPizza Pie Charts
D、Gephi
正确答案:


第11题,数据归约(Data Reduction)主要有()
A、维度规约
B、样本规约
C、数据聚集
D、离散化概念分层
正确答案:,B,C,D


第12题,以下可以用于数据可视化的是()。
A、R语言
B、Excel
C、RapidMiner
D、Weka
正确答案:,B,C,D


第13题,医疗大数据特点:除了包含了大数据4个"V" 的特点之外还有()
A、多态性
B、时效性
C、不完整性
D、冗余性
正确答案:,B,C,D


第14题,大数据存储的特点与挑战有()
A、容量问题
B、延迟问题
C、安全问题
D、成本问题
正确答案:,B,C,D


第15题,大数据智能感知层:主要包括()及软硬件资源接入系统
A、数据传感体系
B、网络通信体系
C、传感适配体系
D、智能识别体系
正确答案:,B,C,D


第16题,数据预处理的过程主要是
A、数据清洗
B、数据集成
C、数据变换
D、数据规约
正确答案:,B,C,D


第17题,交通数据处理包括以下几个步骤()
A、数据清洗
B、数据映射
C、数据组织
D、数据聚类
正确答案:,B,C,D


第18题,数据工厂包括
A、低能耗数据中心
B、超大规模讲分布式架构
C、新一代智能自动化运维
D、超强云安全
正确答案:,B,C,D


第19题,可视化工具包括()
A、Excel
B、Google Chart
C、Gephi
D、ppt
正确答案:,B,C


第20题,去除噪声使得数据光滑的技术主要有:
A、分箱
B、回归
C、离群点分析
正确答案:,B,C


第21题,在未来掘金社交数据的道路上,一方面要为用户提供更加精准便捷的良好服务,另一方面也要注重对用户隐私的保护。只有符合用户需求和用户安全的商业利益,才能成为可持续的商业利益。
T、对
F、错
正确答案:T


第22题,每个簇的质心(centroid)是该簇中所有数据对象的均值。
T、对
F、错
正确答案:T


第23题,数据存储要表现出静态数据的特征,反映的是系统中静止的数据。
T、对
F、错
正确答案:T


第24题,不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态( )
T、对
F、错
正确答案:T


第25题,Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流;或者是从小数据开始,但数据每年增长速率至少为60%。
T、对
F、错
正确答案:F


第26题,未来考验零售企业的是如何挖掘消费者需求
T、对
F、错
正确答案:T


第27题,减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。
T、对
F、错
正确答案:T


第28题,数据存储是数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。
T、对
F、错
正确答案:T


第29题,Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。
T、对
F、错
正确答案:T


第30题,FP算法比Apriori算法慢
T、对
F、错
正确答案:F


第31题,轨迹数据包含空间和时间属性,并且通常规模巨大且维度高
T、对
F、错
正确答案:T


第32题,Apriori算法扫描数据库的次数等于最大频繁项集的项数。
T、对
F、错
正确答案:T


第33题,Facebook积累了超过12亿全球用户,其存储了大量的用户数据,这使它成为一个巨大的"数据乐园"。人们越来愈倾向于在Facebook上表达自己的情绪。
T、对
F、错
正确答案:T


第34题,大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。
T、对
F、错
正确答案:T


第35题,R是一种开源编程语言和软件环境,用于数据挖掘、数据分析和可视化。
T、对
F、错
正确答案:T


第36题,简述数据可视化的流程和步骤。
正确答案:


第37题,简述网络大数据的一般采集过程。
正确答案:


第38题,NoSQL
正确答案:


第39题,批处理
正确答案:


第40题,数据清洗
正确答案:


第41题,结构化数据
正确答案:














需要奥鹏作业答案请扫二维码,加我QQ

添加微信二维码,了解更多学习技巧,平台作业、毕业论文完成时间友情提醒。不再错过任何作业论文。