Data Visualization

数据可视化 / 统计图 / 科研数据表达


🧭 Overview|领域概述

数据可视化(Data Visualization)是将数据转换为**图形化表达(图表、图像、空间结构)**的过程,用于揭示模式、趋势与关系。 (TechTarget)

其核心目标包括:

  • 提高数据理解效率
  • 揭示隐藏结构(patterns / trends / outliers)
  • 支持分析与决策

📌 本质定义(学术表达):

1
Data → Visual Mapping → Cognition Amplification

即:

利用视觉系统增强人类对数据的认知能力 (PMC)


🧱 I. 核心分类体系(Core Taxonomy)

数据可视化在学术上主要分为两大分支:


1. 信息可视化(Information Visualization)

  • 对象:

    • 抽象数据(表格 / 统计 / 社会数据)
  • 特征:

    • 无空间结构
    • 强调关系与统计

📌 典型:

  • 折线图 / 柱状图 / 饼图
  • 网络图 / 关系图

2. 科学可视化(Scientific Visualization)

  • 对象:

    • 具有空间属性的数据
  • 特征:

    • 强调物理意义
    • 多维空间表达

📌 典型:

  • 流体场
  • 医学影像
  • 气候模型

📌 二者本质区别:

1
2
InfoVis → 抽象关系  
SciVis → 物理空间

(PMC)


⚙️ II. 数据可视化流程(Visualization Pipeline)

这是科研中最关键的一条主线:

1
Data → Processing → Mapping → Rendering → Interpretation

展开为:


1. 数据获取(Data Acquisition)

  • 实验数据
  • 观测数据
  • 模拟数据

2. 数据处理(Data Processing)

  • 清洗(Cleaning)
  • 归一化(Normalization)
  • 降维(Dimensionality Reduction)

3. 映射(Visual Encoding)

核心步骤:
👉 将数据映射为视觉变量

  • 位置(Position)
  • 颜色(Color)
  • 大小(Size)
  • 形状(Shape)

4. 渲染(Rendering)

  • 2D 图表
  • 3D 场景
  • 交互式界面

5. 认知与解释(Interpretation)

  • 模式识别
  • 关系理解
  • 决策支持

📌 可视化本质是“认知外包”:
让视觉系统替代大脑计算 (约翰霍普金斯图书馆指南)


📊 III. 统计图体系(Statistical Graphics)


1. 基础图表(Basic Charts)

  • Line Chart(趋势)
  • Bar Chart(比较)
  • Pie Chart(比例)

2. 分布表达(Distribution)

  • Histogram
  • Box Plot
  • Density Plot

3. 关系表达(Relationship)

  • Scatter Plot
  • Correlation Matrix

4. 多维数据(Multivariate)

  • Heatmap
  • Parallel Coordinates
  • PCA / t-SNE

📌 图表选择本质是:

1
Data Type → Visual Form

🧠 IV. 设计原则(Design Principles)


1. 准确性(Accuracy)

  • 不扭曲数据
  • 比例正确

2. 可读性(Clarity)

  • 信息层级清晰
  • 避免视觉噪声

3. 效率(Efficiency)

  • 快速传达信息
  • 降低认知负担

4. 表达性(Expressiveness)

  • 图形能表达数据结构

📌 关键思想:

可视化不仅是“画图”,而是“信息编码”


🔬 V. 科研表达结构(Scientific Expression)

这是你最关键的部分 👇


1. 数据层(Data Layer)

  • 原始数据
  • 统计结果

2. 结构层(Structure Layer)

  • 分布
  • 网络
  • 空间结构

3. 叙事层(Narrative Layer)

  • 结论
  • 逻辑关系

📌 科研图的本质:

1
Data → Structure → Insight → Story

(Coursera)


🧩 VI. 可视化范式(Visualization Paradigms)


1. 探索型(Exploratory)

  • 用于发现规律
  • 面向研究者

2. 解释型(Explanatory)

  • 用于表达结论
  • 面向读者

3. 交互型(Interactive)

  • 可动态分析数据
  • Dashboard / 可视分析

📌 现代趋势:

  • 数据故事(Data Storytelling)
  • AI辅助可视化
  • 实时可视分析

🌍 VII. 应用场景(Applications)


1. 科研

  • 论文图表
  • 模型结果表达

2. 工业 / 商业

  • BI Dashboard
  • 数据分析

3. 医学 / 科学

  • 医学影像
  • 气候模拟

📌 数据可视化是跨领域通用语言


📊 VIII. Summary|结构总结

数据可视化可以抽象为:

1
2
3
① 数据处理:采集 / 清洗 / 分析  
② 视觉映射:位置 / 颜色 / 形状
③ 表达目标:理解 / 分析 / 决策

统一逻辑:

1
Data → Visual → Insight → Decision

📚 Note|栏目说明

本栏目将围绕以下方向展开:

  • 统计图设计(Statistical Graphics)
  • 科研图表达(Scientific Figures)
  • 高维数据可视化(High-dimensional Visualization)
  • 3D / 交互式可视化

重点关注:

  • 图形语言(Visual Encoding)
  • 认知效率(Cognitive Efficiency)
  • 科研表达(Scientific Communication)