自考题库
首页
所有科目
自考历年真题
考试分类
关于本站
游客
账号设置
退出登录
注册
登录
出自:国家开放大学大数据分析与挖掘技术
下列关于随机森林算法,说法正确的是( )。
【A.】建立决策树的过程中,需要注意采样和完全分裂两点;
【B.】建立决策树过程中需要两个随机采样,即行采样和列采样;
【C.】对于行采样,采样无放回的方式;
【D.】采用完全分裂的方式构建决策树,这样决策树的某个叶节点要么无法继续分裂,要么里面的所有样本都指向同一个分类。
随机森林算法建立决策树过程中,对于行采样,采样有放回的方式,也就是在采样得到的样本集合中,可能有重复的样本。
【A.】√
【B.】×
随机森林算法建立决策树过程中,对于行采样,采样无放回的方式。
【A.】√
【B.】×
随机森林的优势是( )。
【A.】能够处理高维度数据,并且不用做特征选择;
【B.】在训练过程中,能够检测到特征间的交互作用;
【C.】训练速度快;
【D.】容易做成并行化方法。
对于解决小样本、非线性及高维模式识别问题,( )表现出许多特有的优势。
【A.】支持向量机
【B.】最近邻分类
【C.】随机森林
【D.】线性判别
支持向量机算法中,超平面到所有两类数据点的距离之和称为分类器的边缘。
【A.】√
【B.】×
以寻找最大边缘超平面为目的,以及构建相应的分类决策函数来分类的算法是( )
【A.】决策树
【B.】线性判别分析
【C.】线性可分支持向量机
【D.】随机森林
构成随机森林的决策树越多,那么( )
【A.】随机森林的预测精度越高
【B.】随机森林的预测精度越低
【C.】随机森林的训练精度越低
【D.】随机森林的训练精度越高
常用的核函数有( )。
【A.】线性核
【B.】高斯核
【C.】神经网络核
【D.】多项式核
非线性支持向量机通过引进核函数解决线性不可分问题。
【A.】√
【B.】×
按照经济发展、教育水平、面积大小、人口等诸多方面对我国地市级以上城市进行分类。通常采用( )。
【A.】回归分析
【B.】分类
【C.】关联分析
【D.】聚类分析
当不知道哪些花是同一品种,哪些花不同品种时,考虑按照花瓣长宽与花萼长宽将不同品种的花分类。通常采用( )。
【A.】聚类分析
【B.】分类
【C.】回归分析
【D.】关联分析
不知道哪些客户有同样的购物习惯与特征等。考虑按照客户的个人资料、购物特征、购物习惯等将客户进行分类。通常采用( )。
【A.】回归分析
【B.】聚类分析
【C.】分类
【D.】关联分析
多元统计分析中的聚类分析方法可以对反映事物特征的指标或变量进行分类,记为( )。
【A.】S型分类
【B.】H型分类
【C.】Q型分类
【D.】R型分类
下列哪一项不属于聚类分析( )。
【A.】系统聚类
【B.】决策树
【C.】Kmeans
【D.】DBSCAN聚类
不知道哪些学生有相同的某些特征。考虑按照学生的考试成绩、社会实践、思想品德等方面划分奖学金的等级。通常采用( )。
【A.】回归分析
【B.】分类
【C.】聚类分析
【D.】关联分析
多元统计分析中的聚类分析方法可以对样本进行分类,记为( )。
【A.】S型分类
【B.】H型分类
【C.】Q型分类
【D.】R型分类
多元统计分析中的聚类分析方法既可以对样本进行分类,记为R型分类,也可以对反映事物特征的指标或变量进行分类,记为Q型分类。
【A.】√
【B.】×
多元统计分析中的聚类分析方法既可以对样本进行分类,记为Q型分类,也可以对反映事物特征的指标或变量进行分类,记为R型分类。
【A.】√
【B.】×
Mahalanobis距离指的是:( )
【A.】明氏距离
【B.】车比雪夫距离
【C.】欧氏距离
【D.】马氏距离
在聚类分析中,如果新类与其他类别之间存在多个点与点之间的距离,通过计算两类重心之间的欧氏距离平方作为两类之间的距离的方法为( )。
【A.】中间距离法
【B.】离差平方和法
【C.】重心法
【D.】类平均法
在聚类分析中,如果新类与其他类别之间存在多个点与点之间的距离,取这些距离最小者作为两类的距离,该方法为( )。
【A.】重心法
【B.】离差平方和法
【C.】最短距离法
【D.】类平均法
在聚类过程中的类需要遵从的原则中,说明了每一个个体在同一次分类过程中只能分在一个类别当中的原则是( )。
【A.】同质性原则
【B.】互斥性原则
【C.】完备性原则
【D.】充分性原则
在聚类分析中,如果新类与其他类别之间存在多个点与点之间的距离,取这些距离最大者作为两类的距离,该方法为( )。
【A.】重心法
【B.】离差平方和法
【C.】最长距离法
【D.】类平均法
首先考虑在没有进行聚类之前,所有参加聚类过程的个体没有归入任何类别,即对于每个个体而言,自成一类的方法是( )。
【A.】关联分析
【B.】系统聚类
【C.】快速聚类
【D.】DBSCAN聚类
在聚类分析中,如果新类与其他类别之间存在多个点与点之间的距离,将公式作为两类的距离,按照最小距离原则吧类别之间距离最小的两类合并为一类,直至把所有样本归为一类,该方法为( )。
【A.】中间距离法
【B.】离差平方和法
【C.】重心法
【D.】类平均法
Euclidean距离指的是:( )
【A.】明氏距离
【B.】车比雪夫距离
【C.】欧氏距离
【D.】马氏距离
下述谱系图使用的是类平均法,横轴表示类别之间的平均距离,纵轴为具体的每个样本。如在图中距离为1.75 处画一条竖线,该直线与谱系聚类图有2个交点,即可把所有样本分为两类。与第1个交点相连的样本是 ( ),它们形成第一类;而与第2个交点相连的样本是( ),它们形成另一类。
【图片】
【A.】turtle、komodo、salamander、frog、penguin、eel;
salmon、leopard shark、whale、python、porcupine、bat、cat、human、pigeon
【B.】turtle、komodo、salamander、frog、penguin、eel、salmon、leopard shark;
whale、python、porcupine、bat、cat、human、pigeon
【C.】turtle、komodo、salamander、frog、penguin、eel、salmon、leopard shark、whale、python;
porcupine、bat、cat、human、pigeon
【D.】turtle、komodo、salamander、frog、penguin、eel、salmon、leopard shark、whale;
python、porcupine、bat、cat、human、pigeon
在聚类分析中,如果新类与其他类别之间存在多个点与点之间的距离,通过用不同类的样本点两两之间的平均距离作为类间距离的方法为( )。
【A.】中间距离法
【B.】离差平方和法
【C.】重心法
【D.】类平均法
下列关于类间距确定方法说法错误的是( )。
【A.】离差平方和法要求样本间距离可以采用欧式距离、马氏距离等;
【B.】重心法考虑了每一类中所包含的样本点数目;
【C.】类平均法充分利用各个样本的信息;
【D.】使用离差平方和作为类间距离时,如果聚类聚得恰当,类内样本点之间的离差平方和应该较小,类间离差平方和应该较大。
在聚类过程中的类需要遵从的原则中,保证了类别之内个体特征的共性的原则是( )。
【A.】同质性原则
【B.】互斥性原则
【C.】完备性原则
【D.】充分性原则
Chebychev距离指的是:( )
【A.】明氏距离
【B.】车比雪夫距离
【C.】欧氏距离
【D.】马氏距离
在聚类过程中的类需要遵从的原则中,保证了类别之间的差异性的原则是( )。
【A.】同质性原则
【B.】互斥性原则
【C.】完备性原则
【D.】充分性原则
在聚类分析中,如果新类与其他类别之间存在多个点与点之间的距离,先让每个样本自身各成一类,然后并类,每并一类离差平方和就要增大,选择使其增量最小的两类合并,直到所有的样本聚为一类,该方法为( )。
【A.】中间距离法
【B.】离差平方和法
【C.】重心法
【D.】类平均法
使用离差平方和作为类间距离时,如果聚类聚得恰当,类内样本点之间的离差平方和应该( ),类间离差平方和应该( )。
【A.】较小;较小
【B.】较小;较大
【C.】较大;较小
【D.】较大;较大
下面哪个原则不是聚类过程中的类需要遵从的原则( )。
【A.】同质性原则
【B.】互斥性原则
【C.】完备性原则
【D.】充分性原则
下列关于类间距确定方法说法正确的是( )。
【A.】离差平方和法要求样本间距离必须采用欧氏距离;
【B.】重心法没有考虑每一类中所包含的样本点数目;
【C.】类平均法没有充分利用各个样本的信息;
【D.】使用离差平方和作为类间距离时,如果聚类聚得恰当,类内样本点之间的离差平方和应该较大,类间离差平方和应该较小。
Minkowski距离指的是:( )
【A.】闵可夫斯基距离
【B.】车比雪夫距离
【C.】欧氏距离
【D.】马氏距离
block距离指的是:( )
【A.】明氏距离
【B.】车比雪夫距离
【C.】绝对距离
【D.】马氏距离
马氏距离是由( )计算出来的相对距离,( )指标之间的相关性。
【A.】协方差矩阵;考虑
【B.】协方差矩阵;不考虑
【C.】相关系数矩阵;考虑
【D.】相关系数矩阵;不考虑
下列关于类间距确定方法说法正确的是( )。
【A.】离差平方和法要求样本间距离必须采用欧氏距离;
【B.】重心法没有考虑每一类中所包含的样本点数目;
【C.】类平均法没有充分利用各个样本的信息;
【D.】使用离差平方和作为类间距离时,如果聚类聚得恰当,类内样本点之间的离差平方和应该较小,类间离差平方和应该较大。
下面哪个原则是聚类过程中的类需要遵从的原则( )。
【A.】同质性原则
【B.】互斥性原则
【C.】完备性原则
【D.】充分性原则
常用的类间距确定的方法有( )。
【A.】最短距离法
【B.】离差平方和法
【C.】重心法
【D.】类平均法
下面哪些距离是明氏距离:( )
【A.】绝对距离
【B.】欧氏距离
【C.】车比雪夫距离
【D.】马氏距离
系统聚类中的类间距离是:( )
【A.】合并后新出现的类与其他类之间的距离
【B.】不能通过前一步的类间距离递推得到
【C.】可以通过前一步的类间距离递推得到
【D.】有多重可以选择的方式
Demirmen 提出了一些在决定聚类方法取舍时应遵循的原则:( )
【A.】任何类必须在邻近的各类中是突出的,即各类重心(常用平均数衡量)之间应该有最大的距离;
【B.】确定的类中,各类所包含的元素都不宜过分多;
【C.】聚类数目应符合实际;
【D.】当用许多方法进行分类时,应选出现次数最多的那种分类结果
设dij表示第i个样本与第j个样本之间的距离。那么距离必须满足的原则有:( )。
【A.】
【B.】
【C.】
【D.】
系统聚类中使用的类间距离不同,聚类结果可能是不同的。
【A.】√
【B.】×
聚类分析中,重心法考虑了每一类中所包含的样本点数目。
【A.】√
【B.】×
聚类分析中,个体与个体之间的距离越远越有可能是一类。
【A.】√
【B.】×
首页
<上一页
7
8
9
10
11
下一页>
尾页