自考题库
首页
所有科目
自考历年真题
考试分类
关于本站
游客
账号设置
退出登录
注册
登录
出自:新疆开放大数据技术导论
绘制频数直方图的一般包括以下几个步骤:
①分组;
②决定组数与组距;组距就是每组两个端点之间的距离;
③计算最大值与最小值的差,确定统计量的范围;
④画频数分布直方图;
⑤列频数分布表;
你认为正确步骤为( )。
A①②③④⑤
B①②④⑤③
C③②①④⑤
D③②①⑤④
当遇到连续数据或者量较多的离散数据时候,最好采用下面哪种图来展示。()
A柱状图
B折线图
C饼图
D散点图
“垃圾邮件的处理”场景属于哪种数据挖掘算法。( )
A分类
B聚类
C回归
D关联
数据挖掘是从数据集(可能是不完全的、有噪声的、不确定性的、各种存储形式的)中挖掘出隐含在其中的、人们事先不知的、对决策有用的( )的过程。
A语义网
B产生式
C知识与信息
D规则
“二手房价格预测”场景属于哪种数据挖掘算法。( )
A分类
B聚类
C回归
D关联
当离散数据较少,且需要类别比较,应该采用下面哪种图来展示。( )
A柱状图
B折线图
C饼图
D散点图
DBSCAN算法属于什么类型的聚类算法( )
A网格聚类算法
B层次聚类算法
C划分型聚类算法
D基于密度的聚类算法
下面哪一项不属于分类算法。( )
A决策树
BFM算法
C随机森林
D人工神经网络
不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别,这里使用的方法是( )。
A分类
B聚类
C回归
D关联
大数据环境下的隐私担忧,主要表现为( )
A个人信息的被识别与暴露
B用户画像的生成
C恶意广告的推送
D病毒入侵
在当前社会中,最为突出的大数据环境是综合国力。
A对
B错
众数不受分布数列的极大或极小值的影响。()
A对
B错
K-means算法属于分类算法。()
A对
B错
大数据有容量大、速度快、多样化的特征。
A对
B错
下面哪个图表适合比较两个或以上的数值,但只有一个变量的情况。()
A柱状图
B折线图
C饼图
D散点图
如下关于大数据分析流程的哪一项是正确的( )。
A数据采集、数据清洗、数据管理、数据分析、数据呈现
B数据清洗、数据采集、数据呈现、数据分析、数据管理
C数据采集、数据呈现、数据分析、数据清洗、数据管理
D数据采集、数据分析、数据清洗、数据管理、数据呈现
在大数据生命周期的各个阶段,工作最多的是哪个阶段?( )
A数据收集和整理
B数据分析
C数据存储
D数据治理
下面哪一项不属于使用数据分析知识对数据进行探索。( )
A最大与最小值
B均值与标准差
C数据的分布
D方差
垃圾邮件的处理”场景属于哪种数据挖掘算法。( )
A分类
B聚类
C回归
D关联
下面哪个图表适合展现随时间而变化的数据()
A柱状图
B折线图
C饼图
D散点图
下面哪一项技术通常用于预测分析,确定两种或两种以上变量之间互相依赖的定量关系。( )
A分类
B聚类
C回归
D关联
以下哪种技术可以自动地抓取互联网公开信息?( )
A网页爬虫
B人工录入
C网页插码采集
D物联网设备采集
观察值的总和除以观测值的个数所得的商数是( )。
A平均数
B中位数
C众数
D方差
数据挖掘在建立模型时需要选择算法,一个模型只能使用一种算法。()
A对
B错
在数据挖掘流程中,准备数据这一环节看似简单,其实往往占据了工作的80%的工作量。()
A对
B错
聚类分析属于有监督学习类型。()
A对
B错
中位数是一组数据里面中间位置的数。()
A对
B错
大数据是一个业务领域的问题。
A对
B错
数据清洗的方法有 填充缺失值、修改错误值、消除重复记录。
A对
B错
大数据的最显著特征是数据处理速度快。
A对
B错
数据的精细化程度是指颗粒度。
A对
B错
下面哪个图表适用于显示数据中不同类型数值之间的关系。( )
A柱状图
B折线图
C饼图
D散点图
数据挖掘在建立模型时需要选择算法,一个模型只能使用一种算法。()
A对
B错
好的聚类方法需要产生高质量的聚类结果,所形成的簇要有高的内部相异性。()
A对
B错
大数据分析的目的是从类型多样的海量数据中挖掘出隐藏的有价值的信息。
A对
B错
首页
<上一页
1
下一页>
尾页