出自:数据挖掘工程师

模式为对数据集的全局性总结,它对整个测量空间的每一点做出描述;模型则对变量变化空间的一个有限区域做出描述。
如果允许一条记录触发多条分类规则,把每条被触发规则的后件看作是对相应类的一次投票,然后计票确定测试记录的类标号,称为()。
A:无序规则
B:穷举规则
C:互斥规则
D:有序规则
数据抽取的两个常见类型是静态抽取和增量抽取。静态抽取用于()填充数据仓库,增量抽取用于进行数据仓库的维护。
何谓聚类?它与分类有什么异同?
给定两个向量对象,分别表示为p1(22,1,42,10),p2(20,0,36,8): (a)计算两个对象之间的欧几里得距离 (b)计算两个对象之间的曼哈顿距离 (c)计算两个对象之间的闵可夫斯基距离,用x=3 (d)计算两个对象之间的切比雪夫距离
置信度(confidence)是衡量兴趣度度量()的指标。
A:简洁性
B:确定性
C:实用性
D:新颖性
支持向量机中常用的核函数有多项式核函数、径向基核函数和()
关于OLAP的特性,下面正确的是() (1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性
A:(1)(2)(3)
B:(2)(3)(4)
C:(1)(2)(3)(4)
D:(1)(2)(3)(4)(5)
下面哪种分类方法是属于神经网络学习算法?()
A:判定树归纳
B:贝叶斯分类
C:后向传播分类
D:基于案例的推理
只有非零值才重要的二元属性被称作:()。
A:计数属性
B:离散属性
C:非对称的二元属性
D:对称属性
遗传算法与传统寻优算法相比有什么特点?
数据从集结区加载到数据仓库中的主要方法是什么?
简述K-中心点算法的输入、输出及聚类过程(流程)。
在判定树归纳中,为什么树剪枝是有用的?
数据挖掘对聚类的数据要求是什么?
简述k-means算法,层次聚类算法的优缺点。
商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者则是一个学习型系统,能自动适应商务不断变化的要求。
当维表中的主键在事实表中没有与外键关联时,这样的维称为()。它于事实表并无关系,但有时在查询限制条件中需要用到。
下列几种数据挖掘功能中,()被广泛的用于购物篮分析。
A:关联分析
B:分类和预测
C:聚类分析
D:演变分析
什么是数据挖掘?
简述数据挖掘的过程。
下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?()
A:数据清理
B:数据集成
C:数据变换
D:数据归约
OLAP技术的核心是()
A:在线性
B:对用户的快速响应
C:互操作性
D:多维分析
图挖掘技术在社会网络分析中扮演了重要的角色。
为什么说相对于日常的应用数据库,数据仓库中的数据更加不容易丢失?
层次聚类方法包括哪些?
数据挖掘的预测建模任务主要包括哪几大类问题?()
A:分类
B:回归
C:模式发现
D:模式匹配
定量属性可以是整数值或者是连续值。
简述数据仓库与数据挖掘的关系?
请列出3种数据仓库产品,并说明其优缺点。