出自:国家开放大学数据可视化技术

词云图通常用于网站或博客,以描述( ) 也可以用来比较两个不同的文本 。
【A.】内容
【B.】关键字
【C.】标签
【D.】简介
箱型图可以用来反映一组或多组连续型定量数据分布的( ) 。
【A.】中心位置
【B.】散布范围
【C.】密集程度
【D.】对称情况
下列对数据可视化方法表述正确的是( ) 。
【A.】数据关系型图表包括展示数据相关性与数据流向两种主要类别的图表
【B.】数据分布型图表主要显示数据集中的数值及其出现的频率或者分布规律
【C.】时间序列型图表强调数据随时间的变化规律或者趋势
【D.】局部整体型图表主要展示数据中的精确位置和地理分布规律
在雷达图中,每个变量都具有自己的轴(从中心开始)。所有的轴都以径向排列,彼此之间的距离相等,所有轴都有相同的刻度。轴与轴之间的网络线通常只做指引用途。每个变量数值会画在其所属轴线之上,数据集内的所有变量将连在一起形成一个多边形。但是,雷达图有一些缺点( ) 。
【A.】在一个雷达图中使用多个多边形,会令图表难以阅读,而且相当混乱
【B.】过多变量也会导致出现太多的轴线,使图表变得复杂,难以阅读
【C.】仅适用于一个维度各项指标占总体的占比情况
【D.】雷达图未能很有效地比较每个变量的数值
从语义上看,有序型数据可分为以下两类。第一类是以时间轴排列的时间序列数据,如( ) 。
【A.】太阳黑子随时间的变化
【B.】化学质谱
【C.】股票交易数据
【D.】奥运会比赛日程
时变型数据的可视化设计空间涉及三个维度,即( ) 。
【A.】时间
【B.】比例尺
【C.】布局
【D.】表达
数据分析的常规步骤包括哪几个步骤?
【A.】探索性数据分析
【B.】模型选定分析
【C.】推断分析
【D.】数据可视化
数据挖掘可以发现哪些类型的知识?
【A.】广义型知识
【B.】特征型知识
【C.】差异型知识
【D.】预测型知识
【E.】偏离型知识
【F.】关联型知识
哪些类型的数据在信息可视化中需要特别关注其空间布局?
A. 时空数据
B. 层次与网络结构数据
C. 文本和跨媒体数据
D. 多变量数据
缺失值插补方法有哪些( )。
【A.】均值/中位数/众数插补
【B.】最近临插补
【C.】回归方法
【D.】插值法
异常值处理方法有哪些( )。
【A.】删除含有异常值的记录
【B.】视为缺失值
【C.】平均值修正
【D.】使用固定值
数值规约的无参数方法有哪些( )。
【A.】直方图
【B.】聚类
【C.】抽样
【D.】参数回归
数据可视化的流程包括( )。
【A.】数据分析
【B.】过滤
【C.】映射
【D.】绘制
以下哪些原则属于格式塔法则包括的内容( )。
【A.】贴近原则
【B.】相似原则
【C.】聚类原则
【D.】经验原则
数据可视化的代表性方法包括( )。
【A.】柱状图
【B.】直方图
【C.】散点图
【D.】折线图
视图的交互主要包括( )。
【A.】LOD控制
【B.】滚动与缩放
【C.】颜色映射的控制
【D.】数据缩放和裁剪工具
哪些方法可以提高可视化的美学性( )。
【A.】聚焦
【B.】平衡
【C.】简单
【D.】缩放
数据可视化的流程中的核心要素包括( )。
【A.】数据表示与转换
【B.】数据增强
【C.】数据的可视化呈现
【D.】用户交互
数据可视化都有一个共同的目的,那就是准确而高效、精简而全面地传递信息和知识。
数据是符号的集合,是表达客观事物的未经加工的原始素材。
数据具有可变形与不确定性
人机交互指人与机器之间使用某种语言,以一定的交互方式,为完成确定任务的信息交换过程。
科学可视化可粗略的分为三类:标量场可视化、向量场可视化和张量场可视化。
信息可视化按数据类型可分为时空数据可视化、层次与网络结构数据可视化、文本和跨媒体数据可视化以及多变量数据可视化。
数据预处理过程包括数据清洗、数据集成、数据支持、数据规约。
数据转换处理包括基于规则或元数据的转换、基于模型与学习的转换等技术,可通过转换实现数据统一,这一过程有利于提高大数据的一致性和可用性。
基于小波变换的特征提取方法主要有:基于小波变换的多尺度空间能量分布特征提取、基于小波变换的多尺度空间的模极大值特征提取、基于小波包变换的特征提取、基于适应性小波神经网络的特征提取。
属性规约的目标是寻找出最小的属性子集并确保新数据子集的概率分布尽可能地接近原来数据集的概率分布。
数据清理指的是通过一些操作,清理信用数据中的空缺、噪声、异常数据等。其具体操作包括空缺值处理,噪声、异常数据的处理等。
数据可视化的设计简化为四个级联的层次,分别为问题刻画层、抽象层、编码层、创建正确完成系统设计的算法的层次
在数据到可视化的映射中,将温度或密度映射为颜色是直观易懂的
大数据环境下可视化相关工具包含matplotlib、pandas、seaborn等
python语言具有丰富的可视化库,一些R中的第三方绘图包也可以和python连接,比如说ggplot。
利用Echarts进行数据可视化时,可以通过dataZoom组件对数轴(axis)进行『数据窗口缩放』『数据窗口平移』操作
Echarts中常用的基本可视化方法包含柱状图、折线图、饼图、散点图、气泡图及仪表盘等
图例组件legend、标题组件title、视觉映射组件visualMap、数据区域缩放组件dataZoom、时间线组件timeline等均为Echarts中的非交互组件
根据不同的侧重点,数据可视化方法的基本类别介绍五类图表类型,数据关系、数据分布、局部整体、时间序列、地理空间
局部整体图表能够显示出局部组成成分与整体的占比信息,主要包括饼图、圆环图、旭日图、华夫饼图、矩形树状图等
时间序列型图表强调数据随时间的变化规律或者趋势,X轴一般为时序数据,Y轴为数值型数据,包括折线图、面积图、雷达图、日历图、柱形图等
在数据可视化过程中,可以选用克利夫兰点图、南丁格尔玫瑰图、径向柱形图、雷达图等图表类型表征数据的比较与对照
用二维统计直方图、箱型图、金字塔图进行数据可视化,可以展现数据的整体面貌
在面向公交的可视化交叉检索系统中,在进行交通出行关键特征提取的基础上,设计了可视化时空检索模块、乘客出行关联分析模块以及乘客出行轨迹可视化模块3个可视化模块。
在轨道交通异常客流可视化分析系统中设计了三种可视化视图,分别为:异常客流检测、异常客流验证以及异常扩散可视化。
数据可视化和数据分析与数据挖掘的目标都是从数据中获取信息与知识,且手段相同
在数据预处理过程中,需要将所有异常值剔除。
格式塔心理学认为,整体等于部分之和,意识等于感觉元素的集合,行为等于反射弧的循环。
设计者在选择数据到可视化元素的映射时应该优先考虑数据的数量和复杂度
数据可视化的基础是数据存储和备份。
对于动态数据的可视化,只需要研究新的软件算法即可
编程类可视化方法包含Echarts.js、D3.js、及Gephi等