自考题库
首页
所有科目
自考历年真题
考试分类
关于本站
游客
账号设置
退出登录
注册
登录
出自:国家开放大学大数据分析与挖掘技术
下列关于函数duplicated()的说法正确的是( )。
【A.】函数结果会返回数据中的所有重复值
【B.】函数结果会返回一个布尔数组
【C.】函数结果表明每一行是否与前面行有重复
【D.】函数结果会返回数据中的所有非重复值
duplicated()函数会返回一个布尔数组,表明每一行是否与前面行有重复。
【A.】√
【B.】×
duplicated()函数可以将数据中的重复值直接筛选出来。
【A.】√
【B.】×
一些数据集是由合并数据源形成的,这就使其有可能含有重复数据或者近似重复的个体。
【A.】√
【B.】×
数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作,数据整合不包括( )。
【A.】删除数据的异常值
【B.】减少接下来处理数据的大小
【C.】改变粒度分析(从精细到粗放尺度)
【D.】提高数据的解释能力
数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作,数据整合包括( )。
【A.】删除数据的异常值
【B.】减少接下来处理数据的大小
【C.】改变粒度分析(从精细到粗放尺度)
【D.】提高数据的解释能力
数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作。
【A.】√
【B.】×
下列关于抽样的说法正确的是( )。
【A.】抽样有多种方法,如有放回抽样、无放回抽样等
【B.】有放回抽样则将抽出来的个体从抽样对象中去除
【C.】无放回抽样有可能对同一个个体抽中了多次
【D.】无放回抽样会有重复的个体
下列关于抽样的说法错误的是( )。
【A.】抽样有多种方法,如有放回抽样、无放回抽样等
【B.】无放回抽样则将抽出来的个体从抽样对象中去除
【C.】有放回抽样有可能对同一个个体抽中了多次
【D.】无放回抽样会有重复的个体
下列关于抽样的说法正确的是( )。
【A.】抽样有多种方法,如有放回抽样、无放回抽样等
【B.】无放回抽样则将抽出来的个体从抽样对象中去除
【C.】有放回抽样有可能对同一个个体抽中了多次
【D.】无放回抽样会有重复的个体
无放回抽样有可能对同一个个体抽中了多次,有放回抽样则将抽出来的个体从抽样对象中去除,因此不会有重复的个体。
【A.】√
【B.】×
有放回抽样有可能对同一个个体抽中了多次,无放回抽样则将抽出来的个体从抽样对象中去除,因此不会有重复的个体。
【A.】√
【B.】×
离散化是一种将连续取值的变量转换成一个分类变量的数据预处理步骤。
【A.】√
【B.】×
离散化是一种将分类取值的变量转换成一个连续变量的数据预处理步骤。
【A.】√
【B.】×
下列关于主成分的属性说法错误的是( )。
【A.】它们是原始变量的线性组合
【B.】它们相互正交(垂直)
【C.】它们捕获了数据差异最小的方向
【D.】它们捕获了数据差异最大的方向
下列关于主成分分析的说法错误的是( )。
【A.】主成分分析一种经典的减少分析变量的方法
【B.】它将数据从原始的低维空间投影到高维空间
【C.】它将数据从原始的高维空间投影到低维空间
【D.】所有原始变量可通过变换的方式得到综合变量,称为主成分
下列关于主成分分析的说法错误的是( )。
【A.】主成分分析一种经典的减少分析变量的方法
【B.】主成分分析一种经典增加分析变量的方法
【C.】它将数据从原始的高维空间投影到低维空间
【D.】它将数据从原始的低维空间投影到高维空间
下列关于主成分分析的说法正确的是( )。
【A.】主成分分析一种经典的减少分析变量的方法
【B.】主成分分析一种经典增加分析变量的方法
【C.】它将数据从原始的高维空间投影到低维空间
【D.】它将数据从原始的低维空间投影到高维空间
下列关于主成分的属性说法正确的是( )。
【A.】它们是原始变量的线性组合
【B.】它们相互正交(垂直)
【C.】它们捕获了数据差异最小的方向
【D.】它们捕获了数据差异最大的方向
下列关于主成分分析的说法正确的是( )。
【A.】主成分分析一种经典的减少分析变量的方法
【B.】它将数据从原始的低维空间投影到高维空间
【C.】它将数据从原始的高维空间投影到低维空间
【D.】所有原始变量可通过变换的方式得到综合变量,称为主成分
主成分分析是一种经典的增加分析变量的方法,它将数据从原始的低维空间投影到高维空间。
【A.】√
【B.】×
主成分是原始变量的线性组合,它们相互正交(垂直),捕获了数据差异最小的方向。
【A.】√
【B.】×
主成分分析是一种经典的减少分析变量的方法,它将数据从原始的高维空间投影到低维空间。
【A.】√
【B.】×
主成分是原始变量的线性组合,它们相互正交(垂直),捕获了数据差异最大的方向。
【A.】√
【B.】×
下列关于设定虚拟变量时应当遵循的原则说法不正确的是( )。
【A.】对于有k个表现值的定性变量,只设定(k-1)个虚拟变量
【B.】虚拟变量的值通常用“0”或“1”来表示
【C.】对于每个样本而言,同一个定性变量对应虚拟变量的值之和不超过1
【D.】设定虚拟变量时对其数量一般不做要求
设定虚拟变量时应当遵循如下哪些原则( )。
【A.】对于有k个表现值的定性变量,只设定(k-1)个虚拟变量
【B.】虚拟变量的值通常用“0”或“1”来表示
【C.】对于每个样本而言,同一个定性变量对应虚拟变量的值之和不超过1
【D.】设定虚拟变量时对其数量一般不做要求
设定虚拟变量时,虚拟变量的值通常用“0”或“1”来表示。
【A.】√
【B.】×
虚拟变量的设定即把对变量的定量描述转化成对定性数据的描述。
【A.】√
【B.】×
虚拟变量的设定即把对变量的定性描述转化成对定量数据的描述。
【A.】√
【B.】×
设定虚拟变量时,对于有k个表现值的定性变量,只设定(k-1)个虚拟变量。
【A.】√
【B.】×
设定虚拟变量时,对于每个样本而言,同一个定性变量对应虚拟变量的值之和不超过1。
【A.】√
【B.】×
下列关于性能评估的指标说法错误的是( )。
【A.】对于预测任务的数据挖掘,性能评估的指标包括平均绝对误差和均方根误差等
【B.】对于分类任务的数据挖掘,评价指标一般可通过一个混淆矩阵计算得到
【C.】数据挖掘方法预测性能的评估是数据挖掘中的一个重要内容
【D.】ROC曲线不是常用的评价方法
下列关于期望预测误差的说法错误的是( )。
【A.】期望预测误差实际上是真实值与预测值在某种损失函数下的差值
【B.】期望预测误差实际上是真实值与预测值在某种损失函数下的平均值
【C.】通常我们使用期望预测误差作为寻优的目标函数
【D.】有监督学习模型的目的是寻找一个可以很好地描述自变量X与因变量Y之间关系的函数f
在回归学习中常用的损失函数是( )。
【A.】0-1损失函数
【B.】平方损失函数
【C.】指数损失函数
【D.】负二项损失函数
下列不属于期望预测误差的是( )。
【A.】模型假设失误带来的误差
【B.】采用某种方法估计最优值时,估计值的平均可能偏离了真实值
【C.】估计值自身由于数据的随机性产生一个波动部分
【D.】一些主观人为因素
下列关于偏差和方差的说法不正确的是( )。
【A.】偏差和方差受模型的复杂度影响
【B.】模型越复杂,偏差越小,方差越大
【C.】模型越复杂,偏差越大,方差越小
【D.】模型越简单,偏差越大,而方差越小
下列不属于通过样本估计期望预测误差的方式的是( )。
【A.】不重复抽样
【B.】重复抽样
【C.】非交叉验证
【D.】交叉验证
下列关于性能评估的指标说法正确的是( )。
【A.】对于预测任务的数据挖掘,性能评估的指标包括平均绝对误差和均方根误差等
【B.】对于分类任务的数据挖掘,评价指标一般可通过一个混淆矩阵计算得到
【C.】数据挖掘方法预测性能的评估是数据挖掘中的一个重要内容
【D.】ROC曲线不是常用的评价方法
下列属于通过样本估计期望预测误差的方式的是( )。
【A.】不重复抽样
【B.】重复抽样
【C.】非交叉验证
【D.】交叉验证
下列关于期望预测误差的说法正确的是( )。
【A.】期望预测误差实际上是真实值与预测值在某种损失函数下的差值
【B.】期望预测误差实际上是真实值与预测值在某种损失函数下的平均值
【C.】通常我们使用期望预测误差作为寻优的目标函数
【D.】有监督学习模型的目的是寻找一个可以很好地描述自变量X与因变量Y之间关系的函数f
下列关于偏差和方差的说法正确的是( )。
【A.】模型越复杂,偏差越大,方差越小
【B.】模型越复杂,偏差越小,方差越大
【C.】模型越简单,偏差越小,方差越大
【D.】模型越简单,偏差越大,方差越小
下列关于偏差和方差的说法不正确的是( )。
【A.】模型越复杂,偏差越大,方差越小
【B.】模型越复杂,偏差越小,方差越大
【C.】模型越简单,偏差越小,方差越大
【D.】模型越简单,偏差越大,方差越小
下列属于常用的损失函数的是( )。
【A.】0-1损失函数
【B.】平方损失函数
【C.】指数损失函数
【D.】负二项损失函数
期望预测误差主要包括( )。
【A.】模型假设失误带来的误差
【B.】采用某种方法估计最优值时,估计值的平均可能偏离了真实值
【C.】估计值自身由于数据的随机性产生一个波动部分
【D.】一些主观人为因素
下列关于偏差和方差的说法正确的是( )。
【A.】偏差和方差受模型的复杂度影响
【B.】模型越复杂,偏差越小,方差越大
【C.】模型越复杂,偏差越大,方差越小
【D.】模型越简单,偏差越大,方差越小
在回归学习中常用的损失函数是指数损失函数。
【A.】√
【B.】×
模型越复杂,偏差越小,方差越大;模型越简单,偏差越大,而方差越小。
【A.】√
【B.】×
通过样本估计期望预测误差一般有重复抽样和交叉验证两种方式。
【A.】√
【B.】×
有监督学习模型的目的是寻找一个可以很好地描述自变量X与因变量Y之间关系的函数f。
【A.】√
【B.】×
模型越复杂,偏差越大,方差越小;模型越简单,偏差越小,而方差越大。
【A.】√
【B.】×
首页
<上一页
1
2
3
4
5
下一页>
尾页