出自:国家开放大学大数据分析与挖掘技术

闵可夫斯基距离的大小与个体指标的观测单位有关,考虑了指标之间的相关性。
【A.】√
【B.】×
系统聚类中的类间距离是合并后新出现的类与其他类之间的距离。
【A.】√
【B.】×
系统聚类可以给出聚类过程,但是要事先确定聚类个数。
【A.】√
【B.】×
马氏距离是由协方差矩阵计算出来的相对距离,考虑了指标的相关性。
【A.】√
【B.】×
马氏距离是由协方差矩阵计算出来的相对距离,没有考虑指标之间的相关性。
【A.】√
【B.】×
闵可夫斯基距离的大小与个体指标的观测单位有关,没有考虑指标之间的相关性。
【A.】√
【B.】×
聚类分析中,类平均法充分利用各个样本的信息。
【A.】√
【B.】×
聚类分析中,离差平方和法要求样本间距离必须采用欧氏距离。
【A.】√
【B.】×
聚类分析中,个体与个体之间的距离越近越有可能是一类。
【A.】√
【B.】×
聚类分析中,类平均法没有充分利用各个样本的信息。
【A.】√
【B.】×
聚类分析中,重心法没有考虑每一类中所包含的样本点数目。
【A.】√
【B.】×
系统聚类可以给出聚类过程,并且不用事先确定聚类个数。
【A.】√
【B.】×
请为名词选择①-④表示其含义的描述,将配好的A-D填写到括号中。设dij表示第i个样本与第j个样本之间的距离。
【A.】①绝对距离 -> ->
【B.】②切比雪夫距离 -> ->
【C.】③马氏距离 -> ->
【D.】④欧氏距离 -> ->
请为名词选择①-⑥表示其含义的描述,将配好的A-F填写到括号中。
【A.】①最小距离法 ->  ->
【B.】②最长距离法 -> ->
【C.】③中间距离法 -> ->
【D.】④重心法 -> ->
【E.】⑤类平均法 -> ->
【F.】⑥离差平方和法 -> ->
有些情况下,研究者对于研究的对象事先知道分为几类,即已知类别的个数,只是不知道这些类别当中的具体样本,该方法是( )。
【A.】关联分析
【B.】系统聚类
【C.】快速聚类
【D.】DBSCAN聚类
快速聚类中,要确定数据到底聚成几个类合适,我们可以设定K从1到K的变化,计算相应的( ),选择其最( )的类别个数。
【A.】SSE;大
【B.】SSE;小
【C.】SSR;大
【D.】SSR;小
快速聚类中,要确定数据到底聚成几个类合适,我们可以设定K从1到K的变化,计算相应的SSE,下图设定了K的取值为1,2,3,4,5,6。K选( )最为合适。
        【图片】

【A.】1
【B.】2
【C.】3
【D.】6
聚类分析中,快速聚类一般用于小样本情况下的样本聚类。
【A.】√
【B.】×
快速聚类要事先确定聚类个数,但是运算速度很快,适合少量数据的情况。
【A.】√
【B.】×
聚类分析中,快速聚类一般用于大样本情况下的样本聚类。
【A.】√
【B.】×
快速聚类要事先确定聚类个数,但是运算速度很快,适合大量数据的情况。
【A.】√
【B.】×
DBSCAN算法中的直接密度可达、密度可达与密度相连理解错误的是( )
【A.】只有核心对象之间相互密度可达
【B.】密度相连是对称关系
【C.】DBSCAN目的是找到密度相连对象的最大集合
【D.】密度可达也是对称关系
下列关于聚类方法说法正确的是( )
【A.】DBSCAN聚类可以用于数据分布不均匀,呈块状分布,并且聚集形态是任意形状的情况。
【B.】快速聚类要事先确定聚类个数,但是运算速度很快,适合少量数据的情况。
【C.】系统聚类可以给出聚类过程,但是要事先确定聚类个数。
【D.】聚类分析中,快速聚类一般用于小样本情况下的样本聚类
利用基于密度的聚类的概念,即要求聚类空间中的一定区域所包含对象的数目不小于某一给定的阈值,该方法是( )。
【A.】关联分析
【B.】系统聚类
【C.】快速聚类
【D.】DBSCAN聚类
DBSCAN 算法需要用户输入两个参数:一个参数是( ),表示以给定点P为中心的圆形邻域;另一个参数是以点P为中心的邻域内最( )点的数量(MinPts)。
【A.】半径;小
【B.】半径;大
【C.】直径;小
【D.】直径;大
DBSCAN算法中,密度可达是直接密度可达的传递闭包,并且这种关系是( )的,该算法的目的是找到密度相连对象的( )集合。
【A.】对称;最小
【B.】对称;最大
【C.】非对称;最小
【D.】非对称;最大
DBSCAN算法的优点是( )。
【A.】当数据量增大时,要求较大的内存支持,I/Q消耗也很大。
【B.】能够有效处理噪声点和发现任意形状的空间聚类。
【C.】DBSCAN算法聚类速度快。
【D.】当空间聚类的密度不均匀、聚类间距相差很大时 聚类质量较差。
DBSCAN算法中的直接密度可达、密度可达与密度相连理解正确的是( )
【A.】只有核心对象之间相互密度可达
【B.】密度相连是对称关系
【C.】DBSCAN目的是找到密度相连对象的最大集合
【D.】密度可达也是对称关系
下列关于聚类方法说法错误的是( )
【A.】DBSCAN聚类可以用于数据分布不均匀,呈块状分布,并且聚集形态是任意形状的情况。
【B.】快速聚类要事先确定聚类个数,但是运算速度很快,适合大量数据的情况。
【C.】系统聚类可以给出聚类过程,但是要事先确定聚类个数。
【D.】聚类分析中,快速聚类一般用于小样本情况下的样本聚类。
下列关于聚类方法说法正确的是( )
【A.】DBSCAN聚类可以用于数据分布不均匀,呈块状分布,并且聚集形态是任意形状的情况。
【B.】快速聚类要事先确定聚类个数,但是运算速度很快,适合大量数据的情况。
【C.】系统聚类可以给出聚类过程,但是要事先确定聚类个数。
【D.】聚类分析中,快速聚类一般用于小样本情况下的样本聚类。
聚类分析中,关于内部评价指标说法正确的是( )。
【A.】DBI指数越大,说明聚类结果越好
【B.】DBI指数越小,说明聚类结果越好
【C.】DI指数越大,说明聚类结果越好
【D.】DI指数越小,说明聚类结果越好
DBSCAN算法的缺点是( )。
【A.】当数据量增大时,要求较大的内存支持,I/Q消耗也很大。
【B.】能够有效处理噪声点和发现任意形状的空间聚类。
【C.】DBSCAN算法聚类速度快。
【D.】当空间聚类的密度不均匀、聚类间距相差很大时 聚类质量较差。
DBSCAN聚类可以用于数据分布均匀,呈块状分布,并且聚集形态是固定形状的情况。
【A.】√
【B.】×
密度相连是对称关系,密度可达是非对称关系。
【A.】√
【B.】×
DBSCAN算法的目的是找到密度相连对象的最小集合。
【A.】√
【B.】×
DBSCAN算法的目的是找到密度相连对象的最大集合。
【A.】√
【B.】×