Skip to content

DIKW金字塔:从数据到智慧的信息层级模型 — 完整解读

6312 字

Where is the wisdom we have lost in knowledge?
Where is the knowledge we have lost in information?
—— Yukikaze

1. 起源与历史

1.1 最早的思想萌芽

DIKW 层级的思想渊源可追溯至 T. S. Eliot 1934 年的诗剧 The Rock

Where is the wisdom we have lost in knowledge?
Where is the knowledge we have lost in information?

这两句诗被称为 DIKW 最早的思想原型,但 Eliot 并未构建完整的层级模型。

1927 年,Clarence W. Barron(道琼斯公司掌门人)在其员工讲话中讨论了 “Knowledge, Intelligence and Wisdom” 的层级关系,这是最早的职场场景下的层级表述之一。

1.2 层级模型的早期构建

  • 1955 年:经济学家 Kenneth Boulding 提出 “signals → messages → information → knowledge” 的变体层级。
  • 1974 年:Nicholas L. Henry 首次在学术论文中区分 data、information、knowledge 三个概念,并使用 “knowledge management” 一词。
  • 1980 年:工程师 Mike CooleyArchitect or Bee? 中援引 data→information→knowledge→wisdom 的层级,批判自动化和计算机化。

1.3 现代 DIKW 的确立

Russell Ackoff(1989 年,在 International Society for General Systems Research 的主席演讲 From Data to Wisdom 中)首次系统化地阐述了 data→information→knowledge→understanding→wisdom 的五层模型。虽然 Ackoff 本人并未使用金字塔图形,但学术界普遍将其视为 DIKW 层级模型的"原始发表者"。

几乎同时,Milan Zeleny(1987 年)将层级映射为知识形式:know-nothing → know-what → know-how → know-why,并添加了 enlightenment(启迪)层。两人均被广泛引为 DIKW 的创立者。

Robert W. Lucky(贝尔实验室,1989 年)在 Silicon Dreams 中以金字塔形式描述了四层信息层级,这是最早的金字塔图形表述之一。

Anthony Debons 及其同事(1988 年)则扩展了更底层的 “events → symbols → rules and formulations → data” 的层级前置链。

1.4 关键时间线

年份人物贡献
1927Clarence W. BarronKnowledge → Intelligence → Wisdom 层级
1934T. S. Eliotwisdom / knowledge / information 诗意图景
1955Kenneth Bouldingsignals → messages → information → knowledge
1974Nicholas L. Henry区分 data/information/knowledge,提出 KM
1987Milan Zeleny映射为知识形式,含 enlightenment
1988Anthony Debons扩展底层事件/符号/规则
1989Russell Ackoff系统阐述 D→I→K→U→W 五层模型
1989Robert W. Lucky金字塔图形化表述
2007Jennifer Rowley系统性综述 DIKW 层级
2007Chaim Zins130+ 定义的系统研究

注:Danny P. Wallace 指出,DIKW 金字塔的确切起源已难以考证,但"data→information→knowledge→wisdom 的层级排列已成为信息科学多年来的通用语"。

2. 在信息论 / 知识管理 / 数据科学中的位置

2.1 信息论中的地位

在信息论(Shannon 范式)中,DIKW 并非核心模型。Shannon 信息论关注的是信息的量化(熵、信道容量、编码),不涉及语义(meaning)或语用(pragmatics)。DIKW 属于语义信息论 / 语用信息论的范畴,与以下理论形成互补:

  • Bar-Hillel & Carnap 语义信息论(1950s):关注陈述的逻辑概率和信息量
  • Dretske 的知识与信息理论(1981):信息是客观的、可量化的知识载体
  • Floridi 的语义信息论:将信息定义为"well-formed, meaningful, and truthful data"

DIKW 提供的是信息价值的层级化理解,是信息科学与认识论的桥梁,而非 Math 化的通信理论。

2.2 知识管理(KM)中的核心地位

DIKW 是知识管理领域最基础的框架模型之一。Rowley(2007)指出:DIKW “在信息管理、信息系统和知识管理文献中经常被引用或隐含使用”。它将 KM 的两大传统——

  • 编码化传统(通过技术手段显性表达知识)
  • 人本化传统(知识内化于人的认知过程)

——统一在一个层级框架中。

2.3 数据科学 / 大数据中的位置

在大数据与数据科学领域,DIKW 被广泛用于解释数据价值转化的逻辑路径:

  • Data → 数据收集、存储、清洗
  • Information → 数据分析、SQL、BI 报表
  • Knowledge → 机器学习建模、模式发现
  • Wisdom → 决策支持、战略行动

Frické(2018)在 Encyclopedia of Big Data 中指出:DIKW “在信息科学和知识管理中被广泛使用……一些图书馆信息科学理论家用它来解释逻辑概念建构,而商业信息管理者则用它来应对现实挑战”。

在数字化转型(intelligence transformation)的话语体系中,DIKW 常被用作"从数据到智能"的叙事框架。

3. 各层级的定义与区分标准

DIKW 金字塔层级示意(从上到下):

层级含义回答问题时间视角
Wisdom 智慧知道为什么做 & 做正确的事Why未来
Knowledge 知识知道怎么做 & 理解因果关系How过去
Information 信息知道是什么 & 结构化数据What过去
Data 数据原始事实、符号、无意义观察过去

3.1 标准定义

层级核心定义回答问题转化过程时间视角
Data离散的、客观的事实或观察,由符号和字符构成,无固有意义无(什么也不是)加工处理(Processing)过去
Information通过上下文关联而变得有用的结构化数据“是什么?"(What)认知组织(Cognition)过去
Knowledge经过文化理解与验证的信息,提供洞察与理解“怎么做?"(How)判断分析(Judgment)过去
Wisdom将知识应用于不同情境的能力,基于价值判断“为什么做?"(Why)决策反思(Decision-Making)未来

3.2 Zeleny 的知识形式映射

层级知识形式含义
DataKnow-nothing无认知
InformationKnow-what知道是什么
KnowledgeKnow-how知道怎么做
WisdomKnow-why知道为什么

3.3 区分标准与争议

Zins(2007) 在其系统研究中梳理了 45 位学者对 data、information、knowledge 的 130 多种定义,发现缺乏实质性共识。他将这些定义归纳为五种模型,差异核心在于三个概念是主观性(subjective)还是客观性/普适性(universal/collective)的:

  • Model 1:三者都是客观的
  • Model 2:data 客观,information 主观,knowledge 主观
  • Model 3:三者都包含主客观维度
  • Model 4:data 客观,information 兼有,knowledge 主观
  • Model 5:data 客观,information 客观,knowledge 主观

Zins 本人主张:信息科学研究 data 和 information(外部/集体层面的可观察现象),但不应研究 knowledge——因为 knowledge 是内部(主观)而非外部(普适-集体)现象。

Ackoff 的独特之处在于他在 knowledge 和 wisdom 之间插入了 understanding(理解) 层。他认为 understanding 是回答"why"的能力,而 wisdom 则是对未来的价值判断。

4. 批评与替代模型

4.1 主要批评观点

4.1.1 Frické 的尖锐批判(2009)

Martin Frické 在 Journal of Information Science 上发表论文"The knowledge pyramid: a critique of the DIKW hierarchy”,从哲学角度批评 DIKW:

  • 循环定义问题:data、information、knowledge 的定义相互依赖(如 data 是"无意义的 facts”,但 facts 本身就是 knowledge),构成逻辑循环
  • 层级关系不成立:信息不是数据的"更高级形式”,知识也不是信息的"更高级形式"——它们是不同类别的概念
  • Wisdom 难以定义:wisdom 在模型中缺乏操作化定义,哲学上 wisdom 与 knowledge 是平行关系而非从属关系
  • 金字塔图形产生误解:金字塔暗示数量递减(如 data 最多、wisdom 最少),但实际中不一定如此

4.1.2 Weinberger 的 HBR 批评(2010)

David Weinberger 在 Harvard Business Review 上指出:

  • DIKW 假设信息处理是"过滤式"的(从大量 data 中提炼少量 wisdom),但网络时代的信息丰富性推翻了这一假设
  • 层级模型暗示"只有通过信息才能获得知识",但人类很多知识来源于实践、直觉和社会互动
  • 智慧不是知识金字塔的顶端,而是知识的恰当运用

4.1.3 其他学术批评

  • Hoppe 等(2011):wisdom 是"人类认知模糊的顶端",难以在计算模型中实现
  • Meter(2020):提出 DIKW 关系非层次性,而是网络化关系(revising the DIKW Pyramid)
  • 循环定义陷阱:如"information is data with meaning"——但 meaning 已经预设了 knowledge

4.2 替代与扩展模型

模型提出者/年份层级结构关键差异
DIKW+UAckoff (1989)D → I → K → Understanding → Wisdom插入"理解"层
DIKEWZeleny (1987)D → I → K → Enlightenment → Wisdom插入"启迪"层
DIKIW多位学者D → I → K → Intelligence → Wisdom插入"智能"层,与 AI 更契合
DIEKDammann (2018)D → I → Evidence → Knowledge以"证据"替代 wisdom,KM 顶端为 K
DIKW + ActionDoD 实践D → I → K → W → Decision → Action增加决策与行动层
信号层扩展Debons (1988)Events → Symbols → Rules → Data → …扩展 data 下层
逆金字塔PavlovicWisdom(最大)→ … → Data(最小)翻转金字塔方向
网络模型Meter (2020)非层次网络关系取消层级假设

4.3 Wisdom 层级是否合理?

关于 Wisdom 层级的核心争论:

  • 支持方(Jakubik & Müürsepp, 2021):Wisdom Management 将取代 KM,wisdom 是知识应用于宏大价值问题的能力
  • 反对方(Frické):wisdom 是哲学概念(涉及伦理、价值),与 information science 的技术范畴异质
  • 折中观点(McDowell, 2021):通过"叙事"(storytelling)桥接 knowledge 与 wisdom

学术共识倾向于:DIKW 在知识管理教学和商务实践中具有启发价值,但在严格的理论层面存在不足,不应被视为精确的科学模型。

5. AGI/AI 时代的新诠释

5.1 AI 对 DIKW 的冲击与重构

2024-2026 年,学术界和产业界对 DIKW 在 AI 时代的适用性展开了重新讨论。核心论点包括:

5.1.1 LLM / 大模型改变了"信息→知识"的跃迁

  • 传统 DIKW 假设从 information 到 knowledge 需要人类的"认知"和"判断",但 LLM 可以通过模式匹配和统计学习直接从大量 data 中提取知识
  • 知识不再是人类的专属领域:AI 可以生成、综合和应用知识
  • 这动摇了 DIKW 作为"人类认知层级"的基本假设

5.1.2 AI 映射到金字塔各层

Chhem Kieth Rethy(2025)等人提出 AI 类型到 DIKW 的映射:

DIKW 层级对应 AI 类型功能
DataPerception AI(感知 AI)IoT 传感器、计算机视觉、语音识别
InformationAnalytical AI(分析 AI)NLP、搜索引擎、数据清洗与结构化
KnowledgeCognitive AI(认知 AI)ML 模式发现、知识图谱、推荐系统
WisdomAutonomous AI / AGI自主决策、价值判断(仍存争议)

5.2 Data → Knowledge 的自动化

当前共识(Jandrić 等,2024;Fadel 等,2024):

  • D → I → K 三层正在被 AI 系统加速甚至完全自动化
  • AI 可以通过 RAG(检索增强生成)、fine-tuning、知识蒸馏等方式实现知识层面
  • Wisdom 仍然被认为是人类的独特领域——因为 wisdom 涉及伦理判断、价值权衡、长远眼光和同理心

“In the Age of AI, the DIKW pyramid is not replaced—it is reimagined. AI accelerates our journey from data to knowledge, but wisdom is still a human responsibility.”
— Mulugeta Woldetsadik (2025)

5.3 AGI 能否达到 Wisdom 层级?

这是一个开放性问题:

  • 乐观派认为 AGI 具备价值推理能力后可以实现"人工智慧"(Artificial Wisdom)
  • 怀疑派指出 wisdom 根植于 embodied experience(具身经验)、情感和社会互动,纯符号系统无法达到
  • 中间派认为 DIKW 需要重构——可能发展为 DIKAIW(Data → Information → Knowledge → AI → Wisdom)或 DIKAGIW 等

5.4 新模型建议:DIKAI 与 DIKAGI

随着 AI 的深入,一些学者建议在塔中插入 AI/AGI 专属层级:

  • DIKAI:Data → Information → Knowledge → AI Insights → Wisdom
  • DIKAGI:Data → Information → Knowledge → AGI → Wisdom
  • DIKIW:Data → Information → Knowledge → Intelligence → Wisdom(已在军事/AI领域使用)

这些模型仍未被广泛接受,但反映了对 DIKW 进行 AI 时代更新的需求。

6. 信息熵(Shannon)与 DIKW 的关系

6.1 Shannon 信息论的框架

Claude Shannon 的信息熵(1948)定义了一个信源的不确定性度量:

H(X) = -Σ p(x) log₂ p(x)

其核心在于:信息量 = 不确定性的消除,完全不涉及信息的意义(semantics)或价值(value)。

6.2 两个不同范式

维度Shannon 信息论DIKW 模型
核心关注信息的量化、传输、编码信息的意义、层次、价值转化
语义是否相关否(语义无关)核心关注语义
度量方式熵(bits)定性描述,无统一度量
应用领域通信工程、数据压缩、密码学知识管理、数据科学、商业智能
信息是否分层否(连续概率空间)严格层级化
人的角色编解码器认知主体、意义创造者

6.3 交叉与互补关系

虽然两者属于不同范式,但可以建立以下映射关系:

6.3.1 Data ↔ 高熵信号

在 Shannon 框架下,未经处理的原始 data(如传感器噪声、随机比特流)具有最高熵值,因为它们的不确定性最大。这与 DIKW 中 data 是"最底层、最丰富但最无意义"的比喻一致。

6.3.2 Information ↔ 熵的降低

当 data 通过上下文变得有意义,不确定性被消除,entropy 降低。从信息论角度,“information” 就是 data 经过编码和模式识别后产生的结构化信号,其 Shannon 信息量(surprisal)可能低于原始 data。

6.3.3 Knowledge ↔ 压缩表示

Knowledge 可以理解为对大量 information 的压缩模型(compressed representation)——类似于机器学习中的参数化模型,以更少的 bits 解释了更多的 data。这与 Minimum Description Length (MDL) 原则精神相通。

6.3.4 Wisdom ↔ 信息价值的元选择

Wisdom 涉及在多个可能的知识模型中选择"最有价值的"而非"最压缩的",这超出了 Shannon 框架。可以引入 Floridi 的语义信息论中的"信息价值"概念来部分解释。

6.4 Floridi 的桥接尝试

Luciano Floridi 的语义信息论试图 bridge Shannon 信息论和 DIKW 之间的鸿沟:

  • 信息 = well-formed + meaningful + truthful data
  • 知识 = 被正确解释的信息(accounted information)
  • 智慧 = 对知识的伦理性与情境化运用

Floridi 的框架为 DIKW 提供了更严格的信息论基础,但仍然面临着从定量(entropy)到定性(meaning/wisdom)的根本性跨越难题。

6.5 定量化尝试

一些学者尝试将 DIKW 层级与信息论中的定量指标结合:

  • 数据层:Shannon 熵 H(X) — 度量原始不确定性
  • 信息层:条件熵 H(X|Y) — 度量上下文消除的不确定性
  • 知识层:互信息 I(X;Y) — 度量模型对系统的解释能力
  • 智慧层:无已知信息论度量 — 涉及 Value of Information (VoI) 和伦理决策

这些映射是启发性的而非严格的,反映了两个范式之间的本质鸿沟:DIKW 是认识论框架,Shannon 信息论是数学通信框架。

7. 总结与展望

7.1 核心发现

  1. DIKW 的起源是多源汇聚:从 Eliot 的诗意表达→Barron 的商业洞察→Boulding 的学术构建→Ackoff/Zeleny/Lucky 的现代定型,并非单一创始者
  2. 在 KM 和数据科学中具有广泛的启发性价值:虽非严格理论,但提供了直观的理解框架
  3. 缺乏严格定义共识:Zins 的 130+ 种定义表明学科内部远未统一
  4. Wisdom 是最大争议点:是否应该包括、如何定义、是否可以计算化仍是开放问题
  5. AI 时代正在重构 DIKW:D→I→K 自动化趋势明显,DIKIW 等扩展模型开始出现
  6. Shannon 信息论与 DIKW 属于不同范式:前者是定量通信理论,后者是定性认知框架,但可建立启发式映射

7.2 未来方向

  • AGI 与 Artificial Wisdom:AGI 能否达到 Wisdom 层级将是下一阶段的辩论焦点
  • 定量化 DIKW:结合信息论、贝叶斯认知科学和 MDL 原则,为 DIKW 寻找更严格的基础
  • 新层级模型:可能逐步被 DIKIW、DKIW(跳过 Information 层)或完全网络化模型所补充或替代
  • 跨文化视角:东方哲学中的"智慧"概念(如佛教的 prajñā、道家的"道")可能为 Wisdom 定义提供新的维度

本报告基于 Wikipedia、Springer、Journal of Information Science、Postdigital Science and Education 及多篇学术论文的综合调研。

参考文献

  1. Ackoff, R. L. (1989). From data to wisdom. Journal of Applied Systems Analysis, 16, 3-9.
  2. Rowley, J. (2007). The wisdom hierarchy: Representations of the DIKW hierarchy. Journal of Information Science, 33(2), 163-180.
  3. Frické, M. (2009). The knowledge pyramid: a critique of the DIKW hierarchy. Journal of Information Science, 35, 131-142.
  4. Frické, M. H. (2018). Data-Information-Knowledge-Wisdom (DIKW) Pyramid, Framework, Continuum. In Encyclopedia of Big Data. Springer.
  5. Zins, C. (2007). Conceptual approaches for defining data, information, and knowledge. JASIST, 58(4), 479-493.
  6. Weinberger, D. (2010). The problem with the data-information-knowledge-wisdom hierarchy. Harvard Business Review.
  7. Jandrić, P. et al. (2024). The DIKW Model in the Age of Artificial Intelligence. Postdigital Science and Education.
  8. Meter, H. (2020). Revising the DIKW Pyramid. Law, Technology and Humans, 2, 69-80.
  9. Hoppe, A. et al. (2011). Wisdom - the blurry top of human cognition in the DIKW-model? EUSFLAT-2011.
  10. McDowell, K. (2021). Storytelling wisdom: Story, information, and DIKW. JASIST, 72(10), 1223-1233.
  11. Jakubik, M. & Müürsepp, P. (2021). From knowledge to wisdom: Will wisdom management replace knowledge management? European Journal of Management and Business Economics, 31(3), 367-389.
  12. Woldetsadik, M. (2025). The DIKW Hierarchy in the Age of AI. INFORLIBNET.
  13. Wallace, D. P. (2007). Knowledge Management: Historical and Cross-Disciplinary Themes. Libraries Unlimited.
  14. Shannon, C. E. (1948). A Mathematical Theory of Communication. Bell System Technical Journal, 27, 379-423.
  15. Floridi, L. (2011). The Philosophy of Information. Oxford University Press.
  16. Zeleny, M. (1987). Management support systems: Towards integrated knowledge management. Human Systems Management, 7(1), 59-70.

本文由 Yukikaze 撰写。