总浏览量:539.52万
北师18秋《数据挖掘》离线作业题目及答案参考

时间:2019-09-09 23:35来源:本站作者:点击: 1244 次

可做奥鹏院校所有作业、毕业论文咨询请添加 QQ:3082882699
微信:jd958787

《数据挖掘》作业(一)
本课程作业由两部分组成。第一部分为“客观题部分”,由5道选择题组成,每题10分,共50分。第二部分为“主观题部分”,简答题1道20分,计算题1道30分。作业总分100分,将作为平时成绩记入课程总成绩。
客观题部分:
一、        选择题(每题10分,共50题)
1、什么是KDD?                                                                                                         (                )
A. 数据挖掘与知识发现            B. 领域知识发现
                  C. 文档知识发现                                    D. 动态知识发现
2、下面哪种不属于数据预处理的方法?                                                                 (                )
A. 变量代换                   B. 离散化                          C. 聚集                         D. 估计遗漏值         
3、假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等宽划分时(宽度为50),15在哪个箱子里? 
(                )
A. 第一个                      B. 第二个                           C. 第三个                   D. 第四个     
4、min-max规范化方法的值域是什么?                                                                (                )
A. [new_min, new_max]
B. (-∞,+∞)
C. (-1.0, 1.0)
D. (0,1)
5、关于数据仓库与数据库的不同点,说法错误的是:                                        (                )
A. 数据库是面向主题设计的;数据仓库是面向事务设计的。
B. 数据库一般存储在线交易数据;数据仓库存储的一般是历史数据。
C. 数据库设计是尽量避免冗余,一般采用符合范式的规则来设计;数据仓库在设计是有意引入冗余,采用反范式的方式来设计。
D. 数据库是为捕获数据而设计;数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表
主观题部分:
一、        简答题(20分) 
为什么说概念分层在数据挖掘中的是有用的?
答: 
二、 计算题(30分)
假设给定的数据集的值已经分组为区间。区间和对应的频率如下:
年龄        频率
1 ~ 5        200
5 ~ 15        450
15 ~ 20        300
20 ~ 50        1500
50 ~ 80        700
80 ~ 110        44
计算数据的近似中位数值。
答: 

需要奥鹏作业答案请扫二维码,加我QQ

添加微信二维码,了解更多学习技巧,平台作业、毕业论文完成时间友情提醒。不再错过任何作业论文。