数据挖掘工程师 - 自考题库

出自:数据挖掘工程师

帮助市场分析人员从客户的基本信息库中发现不同的客户群，通常所使用的数据挖掘功能是（）。
A:关联分析
B:分类和预测
C:聚类分析
D:孤立点分析
E:演变分析

从结构的角度看，数据仓库模型包括以下几类？（）
A:企业仓库
B:数据集市
C:虚拟仓库
D:信息仓库

基于网格的聚类方法的优点是：（）

支持度（support）是衡量兴趣度度量（）的指标。
A:实用性
B:确定性
C:简洁性
D:新颖性

对于SVM分类算法，待分样本集中的大部分样本不是支持向量，移去或者减少这些样本对分类结果没有影响。

为什么说数据仓库具有随时间而变化的特征？

数据清理的目的是处理数据中的（）。
A:空缺值
B:噪声数据
C:不一致数据
D:敏感数据

考虑值集{12，24，33，2，4，55，68，26}，其四分位数极差是：（）。
A:31
B:24
C:55
D:3

数据聚合的目的是什么？

列举关联规则在不同领域中应用的实例。

什么是ETL？

元数据是描述数据仓库内数据的结构和建立方法的数据，它为访问数据仓库提供了一个信息目录，根据数据用途的不同可将数据仓库的元数据分为（）和业务元数据两类。

给定由两次运行K均值产生的两个不同的簇集，误差的平方和最大的那个应该被视为较优。

下面哪种数据挖掘方法可以用来检测孤立点？（）
A:概念描述
B:分类和预测
C:聚类分析
D:演变分析

简述基于划分的聚类方法。划分的准则是什么？

在评价不平衡类问题分类的度量方法有如下几种，（）。
A:F1度量
B:召回率（recall）
C:精度（precision）
D:真正率（ture positive rate，TPR）

以下属于可伸缩聚类算法的是（）。
A:CURE
B:DENCLUE
C:CLIQUE
D:OPOSSUM

简单地将数据对象集划分成不重叠的子集，使得每个数据对象恰在一个子集中，这种聚类类型称作（）。
A:层次聚类
B:划分聚类
C:非互斥聚类
D:模糊聚类

数据仓库发展演变的5个阶段是什么？

大型数据库中的关联规则挖掘包含两个过程（）和（）

数据立方体度量可以根据其所使用的聚集函数分为三类，分别是：（）、（）和（）

假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述，通常所使用的数据挖掘功能是（）。
A:关联分析
B:分类和预测
C:孤立点分析
D:演变分析
E:概念描述

划分聚类方法对数据集进行聚类时包含什么要点？

什么是数据仓库的数据ETL过程？

对于数据挖掘中的原始数据，存在的问题有：（）。
A:不一致
B:重复
C:不完整
D:含噪声
E:维度高

聚类分析中常见的数据类型有哪些？

从信息处理角度看，神经元具有哪些基本特征？写出描述神经元状态的M-P方程并说明其含义。

首页 <上一页 1 2 3 4 5 下一页> 尾页