自考题库
首页
所有科目
自考历年真题
考试分类
关于本站
游客
账号设置
退出登录
注册
登录
出自:数据挖掘工程师
一个典型的数据挖掘系统应该包括哪些组成部分?
存放最低层汇总的方体称为()。
A:顶点方体
B:方体的格
C:基本方体
D:维
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()
A:关联规则发现
B:聚类
C:分类
D:自然语言处理
具有较高的支持度的项集具有较高的置信度。
数据挖掘
何谓OLTP和OLAP?它们的主要异同有哪些?
多维分析是指以“维”形式组织起来的数据采取切片、切块、()和旋转等各种分析动作,以求剖析数据,使拥护能从不同角度、不同侧面观察数据仓库中的数据,从而深入理解多维数据集中的信息。
Web数据挖掘是通过数据库仲的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息。
简述数据的定义及类型。
数据挖掘技术对聚类分析的要求有哪几个方面?
考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是()。
A:2
B:3
C:3.5
D:5
以下哪些分类方法可以较好地避免样本的不平衡问题,()。
A:KNN
B:SVM
C:Bayes
D:神经网络
哪种数据变换的方法将数据沿概念分层向上汇总?()
A:平滑
B:聚集
C:数据概化
D:规范化
在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:()。
A:有放回的简单随机抽样
B:无放回的简单随机抽样
C:分层抽样
D:渐进抽样
OLAM技术一般简称为”数据联机分析挖掘”,下面说法正确的是:()。
A:OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性
B:由于OLAM的立方体和用于OLAP的立方体有本质的区别
C:基于WEB的OLAM是WEB技术与OLAM技术的结合
D:OLAM服务器通过用户图形借口接收用户的分析指令,在元数据的知道下,对超级立方体作一定的操作
下面哪些属于可视化高维数据技术?()
A:矩阵
B:平行坐标系
C:星形坐标
D:散布图
E:Chernoff脸
OLAP系统和OLTP系统的主要区别包括()。
A:OLTP系统主要用于管理当前数据,而OLAP系统主要存放的是历史数据
B:在数据的存取上,OLTP系统比OLAP系统有着更多的写操作
C:对OLTP系统上的数据访问量往往比对OLAP系统的数据访问量要大得多
D:OLAP系统中往往存放的是汇总的数据,而OLTP系统中往往存放详细的数据
在多维关联规则挖掘中,我们搜索的不是频繁项集,而是()
下表中列出了4个点的两个最近邻。使用SNN相似度定义,计算每对点之间的SNN相似度。
如下哪些不是基于规则分类器的特点,()。
A:规则集的表达能力远不如决策树好
B:基于规则的分类器都对属性空间进行直线划分,并将类指派到每个划分
C:无法被用来产生更易于解释的描述性模型
D:非常适合处理类分布不平衡的数据集
DBSCAN是相对抗噪声的,并且能够处理任意形状和大小的簇。
数据挖掘要解决的问题是什么?
为什么朴素贝叶斯分类称为“朴素”的?简述朴素贝叶斯分类优缺点。
简述特征子集选择的搜索策略。
噪声和伪像是数据错误这一相同表述的两种叫法。
特征提取技术并不依赖于特定的领域。
已知数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用min-max规范化,将age值35转换到[0.0,1.0]区间。 (b)使用z-score规范化转换age值35,其中,age的标准偏差为12.94年。 (c)使用小数定标规范化转换age值35。
以下是一个商场所销售商品的价格清单(按递增顺序排列,括号中的数表示前面数字出现次数) 1(2)、5(5)、8(2)、10(4)、12、14(3)、15(5)、18(8)、20(7)、21(4)、25(5)、28、30(3)。 请分别用等宽的方法和等高的方法对上面的数据集进行划分。
一个数据仓库系统的建立通畅需要经过哪些步骤?
关于K均值和DBSCAN的比较,以下说法
不正确
的是()。
A:K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象
B:K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念
C:K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
D:K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇
首页
<上一页
1
2
3
4
5
下一页>
尾页