出自:国家开放大学大数据技术导论复习题

数值约简是利用替代的方式,使用较小的数据表示替换或估计数据,进而可以减少数据量。()
【A.】√
【B.】 ×
数值约简技术分为有参数值约简技术和无参数值约简技术。()
【A.】√
【B.】 ×
无参数值约简技术主要用于存放约简数据的表示,其主要有线性回归模型、直方图、聚类和选择等。()
【A.】√
【B.】 ×
数据集成是应用、存储以及各组织之间传送的数据管理实践活动,其主要考虑合并规整数据问题。()
【A.】√
【B.】 ×
数据集成是指将不同来源、不同格式、不同特点与不同性质的数据在逻辑上或物理上有机地集中,存放在一个一致的数据存储 (如数据仓库)中。()
【A.】√
【B.】 ×
多维可视化的基本方法主要包括基于几何图形、基于图标、基于像素、基于层次结构和基于图结构的混合方法。()
【A.】√
【B.】 ×
数据集成最复杂和困难的问题是数据格式转换,也就是将多种数据格式转换为统一的格式。()
【A.】√
【B.】 ×
数据源的异构性一直是困扰数据集成系统的核心问题,异构性的难点主要表现在语法异构和语义异构。()
【A.】√
【B.】 ×
持久化数据的安全通过不同层次的管理来实现,即物理层、网络层和数据存储层。()
【A.】√
【B.】 ×
大数据分析是指用准确的分析方法和工具来分析经过预处理后的大数据,提取具有价值的信息,进而形成有效的结论,并通过可视化技术展现出来的过程。()
【A.】√
【B.】 ×
大数据挖掘方法以建模理论、数据仓库、机器学习等复合技术为主,数据挖掘是大数据分析的核心,占有重要的地位。()
【A.】√
【B.】 ×
数据分析的分析目标比较明确,分析条件也比较清楚,基本上就是采用统计方法对数据进行多维度的描述,其从一个假设出发,需要自行选择方程或模型来与假设匹配。而数据挖掘不需要假设,其目标不是很清晰,可以自动建立方程与模型。()
【A.】√
【B.】 ×
多维数据分析的目标是探索多维数据项的分布规律和模式,并揭示不同维度属性之间的隐含关系。()
【A.】√
【B.】 ×
从分析的结果上来看,大数据分析主要分为探索性数据分析、证实性数据分析、定性数据分析;从分析的方式上来看,大数据分析主要分为离线数据分析、在线数据分析和交互式分析。()
【A.】√
【B.】 ×
探索性数据分析是从基于数据本身的角度来说明数据分析方法,涉及模型的假设和统计推断。()
【A.】√
【B.】 ×
探索性数据分析是从原始数据入手,不完全以实际数据为依据。()
【A.】√
【B.】 ×
证实性数据分析可以评估观察到的模式或效应的再现性。()
【A.】√
【B.】 ×
探索性数据分析强调灵活探求线索和证据,而证实性数据分析则着重评估现有证据。()
【A.】√
【B.】 ×
定性数据分析是指定性研究照片和观察结果等非数值型数据的分析,其是对对象性质特点的一种概括。()
【A.】√
【B.】 ×
通过数据的数字特征分析,反映数据的集中位置、分散程度、分布形状等,就可以进一步推断出样本中包含的总体信息。()
【A.】√
【B.】 ×
变异系数不能消除单位和平均值不同对两个或多个数据变异程度比较的影响。()
【A.】√
【B.】 ×
偏度系数和峰度系数是可刻画数据不对称程度或尾重程度的指标。()
【A.】√
【B.】 ×
统计学是收集、分析、表述和解释数据的科学,其是指对某一现象数据的搜集、整理、计算、分析、解释和表述等活动。()
【A.】√
【B.】 ×
模型是指对于某个实际问题或客观事物、规律进行抽象后的一种形式化表达方式。()
【A.】√
【B.】 ×
数据挖掘是大数据分析的核心,其通过建模和构造算法来获取信息与知识。()
【A.】√
【B.】 ×
我们将反映多元线性相关关系的统计指标称为复相关系数。()
【A.】√
【B.】 ×
回归分析是确定一个随机变量Y对另一个变量X或一组(X1,X2,…,Xk)变量的相依关系的统计分析方法。()
【A.】√
【B.】 ×
判别分析是分类方式事先确定,根据若干变量值判断对象归属问题的一种多变量统计分析方法。()
【A.】√
【B.】 ×
聚类就是自动将数据对象分成多个类或簇,划分的原则是在同一个簇中的数据对象具有较高的相似度,而不同簇中的数据对象相似度差别较大。()
【A.】√
【B.】 ×
假设分为两种,一种是原假设,另一种是备选假设。()
【A.】√
【B.】 ×
检验假设是数理统计学中根据一定假设条件由样本推断总体的一种方法,先对总体的特征进行某种假设,然后通过抽样研究的统计推理,决定拒绝这个假设还是接受这个假设。()
【A.】√
【B.】 ×
可视化可以使用计算机支持的、交互的方式来表示抽象数据,以增强用户的认知能力,其侧重于通过可视化文本展现数据中隐含的信息和规律,建立符合人的认知规律的心理映像。()
【A.】√
【B.】 ×
由于数据随着时间而变化,可以将数据变化可视化,然后解释导致数据变化的原因。()
【A.】√
【B.】 ×
由大及小的可视化展现方式是:先给出一个整体的画面,可以引导阅读者具体深入到一个聚焦的点。()
【A.】√
【B.】 ×
在数据比较的可视化展现中,可以对数据集中突出的不同方面给出一个有力的叙述与说明。()
【A.】√
【B.】 ×
地图就是依据一定的数学法则,使用地图语言、颜色、文字注记等,通过制图综合在一定的载体上,表达地球(或其他天体)上各种事物的空间分布、组合、联系、数量和质量特征及在时间中的发展变化状态绘制的图形,其科学地反映出自然和社会经济现象的分布特征及其相互关系。()
【A.】√
【B.】 ×
地图的构成要素只包括图形要素和数学要素。()
【A.】√
【B.】 ×
数学要素用来确定地学要素的空间相关位置,是地图内容骨架的要素。()
【A.】√
【B.】 ×
地图是地理信息的载体,其容纳和储存了巨大数量的信息,而作为信息的载体,只能是传统概念上的纸质地图、实体模型。()
【A.】√
【B.】 ×
将抽象的指标数据转换成容易感知的数据时,用户便更容易理解图形要表达的意义。()
【A.】√
【B.】 ×
气泡图是柱状图的一种变体,通过每个点的面积大小来反映第三维。()
【A.】√
【B.】 ×
根据信息的特征可以将信息可视化分为一维信息可视化、二维信息可视化、三维信息可视化、多维信息可视化、层次信息可视化、网络信息可视化、时序信息可视化。()
【A.】√
【B.】 ×
文本数据是典型的结构化数据类型。()
【A.】√
【B.】 ×
文本可视化可以将文本中蕴含的语义特征直观地展示出来,这些语义特征主要有词频与重要度、逻辑结构、主题聚类、动态演化规律等。()
【A.】√
【B.】 ×
时空数据是带有地理位置与时间标签的数据。()
【A.】√
【B.】 ×
维数灾难通常是指在涉及向量计算的问题中,随着维数的增加,计算量呈指数倍增长的一种现象。()
【A.】√
【B.】 ×
平方根转换适用于等比数据。()
【A.】√
【B.】 ×
Cyber空间与信息化是什么?
数据科学的定义?
数据加工的定义?