出自:佳木斯大学语言治疗学

大数据的起源是( )。
· 金融
· 电信
· 互联网
· 公共管理
当前大数据技术的基础是由( )首先提出的。
· 微软
· 百度
· 谷歌
· 阿里巴巴
在以下深度学习模型中,哪一个最适合处理具有非线性决策边界的数据
· 感知器
· 支持向量机
· 深度神经网络
· K-最近邻算法
当使用随机森林进行分类时,以下哪个参数最重要
· 树的最大深度
· 分割点的选择
· 树的数目
· 每个节点的最小样本分割数
下列选项中,关于Hadoop集群说法正确的是( )。
· Hadoop集群包含Worker节点
· Hadoop 集群包含Master节点
· Hadoop 集群包含Slave节点
· Hadoop 集群包含HMaster节点
下列选项中,属于Hadoop版本系列的有( )。
· Hadoop4
· Hadoop2
· Hadoopl
· Hadoop3
在数据生命周期管理实践中,( )是
· 数据存储和备份规范
· 数据管理和维护
· 数据价值发觉和利用
· 数据应用开发和管理
美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。
· 在数据基础上倾向于全体数据而不是抽样数据
· 在分析方法上更注重相关分析而不是因果分析
· 在分析效果上更追究效率而不是绝对精确
· 在数据规模上强调相对数据而不是绝对数据
以下哪个指标用于衡量数据的集中趋势
· 标准差
· 平均数
· 四分位数
· 方差
以下哪个图形最适用于显示两个变量之间的关联程度
· 条形图
· 散点图
· 直方图
· 箱线图
当使用Python进行数据分析时,以下哪个库最适合处理CSV文件
· NumPy
· Pandas
· Matplotlib
· Scikit-learn
当使用线性回归对一个因变量和多个自变量进行建模时,以下哪个图形最有助于可视化结果
· 条形图
· 散点图矩阵
· 主成分分析图
· 热力图
Hive数据表插入数据时,insert ( ) table .... 括号中可使哪些关键字( )
· into
· append
· overwrite
· to
下列选项中,属于Google提出的处理大数据的技术手段有( )。
· Map Reduce
· My SQL
· Big Table
· GFS
下列选项中,属于Sqoop指令的参数有( )。
· import
· output
· input
· export
在Zookeeper选举过程中,-共有四种状态,分别是( )。
· 竞选状态
· 随从状态
· 观察状态
· 领导者状态
下列说法中,关于crontab表达式说法正确的是( )。
· 通过执行crontab表达式可以执行定时任务
· crontab 表达式是由6个参数决定
· Crontab 表达式是由5个参数决定
· 以上说法均正确
Hadoop提供的自定义配置时编辑的配置文件中,包含( )。
· core- site. xml
· hdfs-site. xml
· mapred-site. xml
· yarn- site. xml
下列哪项可以作为集群的管理( )
· Puppet
· Pdsh
· Cloudera Manager
· Zookeeper
下列选项中,属于Hadoop优势的有( )。
· 扩容能力强
· 可靠性
· 低效率
· 高容错性
当前社会中,最为突出的大数据环境是( )。
· 互联网
· 物联网
· 综合国力
· 自然资源
大数据的最显著特征是( )。
· 数据规模大
· 数据类型多样
· 数据处理速度快
· 数据价值密度高
下列关于数据重组的说法中,错误的是( )。
· 数据重组是数据的重新生产和重新采集
· 数据重组能够使数据焕发新的光芒
· 数据重组实现的关键在于多源数据融合和数据集成
· 数据重组有利于实现新颖的数据模式创新
当使用逻辑回归对二元分类问题进行建模时,以下哪个参数最能影响模型的性能
· 代价参数C
· 多分类策略
· 核函数
· 正则化参数
在以下统计方法中,哪一个最适合用于检测两个独立样本之间的差异
· t检验
· 卡方检验
· 方差分析
· 相关分析
两因素间互作称为二级互作,三因素间的互作为三级互作。
·正确
·错误
在进行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。
·正确
·错误
某玉米株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大
·正确
·错误
由8个小麦新品系和2个对照品种组成3次重复的品比试验,属于单因素试验。
·正确
·错误
设一样本有7个观察值,6、10、9、6、12、7、13,则方差为2.828。
·正确
·错误
实施一个试验在安排区组时原则上应尽可能保持区组内的最大一致性,区组间允许较大差异。
·正确
·错误
将一块环境条件相近的试验田划分成30个面积相同的小区,不再做其他处理,观测某品种小区产量是一个随机试验。
·正确
·错误
若无效假设为H0:μ1=μ2,那么备择假设为H A:μ1≠μ2。
·正确
·错误
若做100次随机试验,一个事件出现20次,则事件的近似概率是0.2
·正确
·错误
随机区组设计试验中,区组数等于重复次数。
·正确
·错误
采用统计值去推论参数值是抽样调查的重要目的之一。 ( )
·正确
·错误
当抽样是分几个阶段,且在不同层次上进行时,只要建立一个抽样框即可。( )
·正确
·错误
社会测量比自然科学的测量更容易受到“测不准原理”的影响。( )
·正确
·错误
邮寄问卷法的调查结果出现偏差的可能性是很小的。( )
·正确
·错误
当调查只实施一次时,通常采用折半信度的方法来估计测量的信度。( )
·正确
·错误
作为一种社会研究方法,调查研究肇始于近代的社会问题研究。 ( )
·正确
·错误
调查研究是一种标准化程度较高的研究方法,其实施过程有一套相对固定的程序( )
·正确
·错误
自填问卷的回收率比较低,邮件问卷的回收率相比之下高一些。( )
·正确
·错误
在确定总体时,真正具有操作意义的是确定抽样框。( )
·正确
·错误
一般说来,如果各层均值有很大差异,按最优分配比较好( )
·正确
·错误
对金鱼草花色进行遗传研究,以红花亲本和白花亲本杂交,F为粉红色,F群体有3种表现型:红花12196株,粉红花419株,白花218株。检验F分离比例是否符合1:2:1的理论比例的分析方法是( )。
·方差的同质性检验
·F检验
·独立性检验
·适合性检验
在多因素试验中,每一个( )是一个处理。
·水平组合
·水平
·处理
·组合
根据某地区1985-2005年间小麦单位面积产量及秋季降雨量的关系,计算得r = -0.632,这一结果表明( )。(r =0.561,r =0.549) ,,0.01180.0119
·小麦单位面积产量与秋季降雨量无关
·小麦单位面积产量随秋季降雨量的增加极显著地减少
·小麦单位面积产量随秋季降雨量的增加而增加
·小麦单位面积产量随秋季降雨量的减少而增加
农业试验中应用最多的平均数是()。
·设立对照
·全面实施
·唯一差异
·相差等距或等比例
对一批棉花种子做发芽试验,抽样1000粒,得发芽种子890粒,若规定发芽率达90%为合格,这批种子的检验结果与合格种子发芽率90%的差异为( )。
· 不显著
· 显著
· 极显著
· 不好确定