一、概述
本体论(Ontology)是哲学中研究"存在"(being)的学科,传统上被理解为形而上学的一个子领域,专注于现实的最一般特征。作为最基础的概念之一,"存在"涵盖了全部现实及其中的每一个实体。
该词源自古希腊语 ὄντως(ontos,意为"存在")和 λογία(logia,意为"研究"),字面意思即"对存在的研究"。术语"ontology"(或 ontologia)于1613年由哲学家 Rudolf Göckel(Goclenius)等人独立创造。
"一部形而上学史乃是存在的遗忘史。" —— 海德格尔
本体论不仅是一个古老的哲学问题,在21世纪它已扩展到计算机科学、人工智能、生物医学信息学、软件工程等诸多领域,成为连接哲学思辨与技术实践的重要桥梁。
二、哲学本体论
本体论探讨存在的本质、实体分类以及现实的最基本结构。它试图回答"什么存在?"、"存在的基本类别有哪些?"以及"不同实体之间的关系是什么?"等根本问题。
2.1 本体论与形而上学的关系
本体论与形而上学的确切关系在学界仍有争议。传统上,本体论被视为形而上学的子学科——形而上学研究根本现实的各个方面,而本体论仅限于现实的最一般特征。另一种理解将本体论视为提供现实完整清单的预备学科,而形而上学则考察这些实体的特征和结构。部分哲学家将两个术语作为同义词使用。
2.2 存在的范围
本体论的范围涵盖多样化的实体,包括日常物体、生物、天体、理念、数字以及虚构生物。核心议题包括:
个别与普遍
个别实体(如苏格拉底)是独特的、不可重复的;普遍实体(如"绿色")是一般的、可重复的。
柏拉图亚里士多德具体与抽象
具体对象存在于时空之中(如一棵树);抽象对象在时空之外(如数字7)。
数学哲学因果力实体与属性
实体是支撑属性的基础存在,能独立存在并在变化中保持同一性。
substanceproperty可能与必然
可能性描述"可以是如何",必然性描述"必须是如何"。常借助"可能世界"概念来分析。
模态逻辑可能世界三、本体论的历史脉络
四、核心概念
4.1 范畴体系(Categories)
范畴是存在的最高种类。自亚里士多德以来,哲学家试图通过范畴系统提供对现实的完整清单。常见范畴包括:实体(substance)、属性(property)、关系(relation)、事态(state of affairs)和事件(event)。
4.2 本体论依赖
本体论依赖描述实体之间的依存关系。一个实体依赖另一个实体,意味着前者不能脱离后者独立存在。例如,苹果的表面不能脱离苹果而存在。这一概念在当代本体论中处于核心地位,与形而上学奠基(metaphysical grounding)密切相关。
4.3 实在论与反实在论
| 立场 | 核心观点 | 代表人物 |
|---|---|---|
| 柏拉图实在论 | 普遍者具有独立于心灵和个别事物的客观存在 | 柏拉图 |
| 亚里士多德实在论 | 普遍者只有在有个别事物例示时才存在(温和实在论) | 亚里士多德 |
| 概念论 | 普遍者只作为心灵中的概念存在 | 阿伯拉尔 |
| 唯名论 | 普遍者根本不存在,世界完全由个别物体组成 | 奥卡姆的威廉 |
| 本体论 deflate 主义 | 不存在实质性的本体论事实,问题取决于语言框架 | 卡尔纳普 |
4.4 一元论与二元论
一元论认为在最基本层面上只有一种事物或实体。唯物主义主张一切皆为物质;唯心主义认为一切皆为精神;中性一元论则认为心和物都是衍生现象。二元论主张心灵和物质是独立的原则。
五、本体论的主要分支
5.1 纯本体论(Pure Ontology)
专注于存在概念和本性的最抽象议题,不限于特定实体领域,研究存在和现实的整体结构。
5.2 应用本体论(Applied Ontology)
将本体论理论和原则应用于特定学科和领域。社会本体论研究金钱、性别、社会等社会种类的本质。在计算机科学领域,应用本体论致力于开发形式化框架,以结构化方式编码和存储特定领域信息。
5.3 形式本体论(Formal Ontology)
研究对象的抽象结构和特征,借助形式逻辑工具以抽象和一般的方式表达发现。与材料本体论(关注特定领域的特征)形成对比。
5.4 元本体论(Meta-ontology)
研究本体论的底层概念、假设和方法。不同于其他本体论分支,它不问"什么存在",而是问"存在意味着什么"以及"如何确定什么存在"。与海德格尔的"基础本体论"密切相关。
5.5 过程本体论(Process Ontology)
主张过程或事件是基本的实体,强调现实中没有什么是静态的,存在是动态的、以持续变化为特征的。
六、当代争论
当代形而上学中的本体论争论涵盖了多个前沿话题:
抽象对象
数字、属性、命题等抽象实体是否真实存在?Chris Swoyer 论证其存在,Cian Dorr 则持反对意见。
可能世界
David Lewis 的模态实在论认为可能世界与实际世界一样真实具体。反对者认为它们仅以抽象或虚构对象的形式存在。
元本体论争议
Eli Hirsch 认为本体论争论只是语言用法不同,Matti Eklund 反对本体论相对主义。
组合问题
什么条件下的实体集合构成一个新对象?无限制组合论 vs 蛮力限制组合论。
三维论 vs 四维论
物体是仅存在于当前时刻(三维论),还是在时空中延伸为"时空虫"(四维论)?
本体论承诺
奎因的标准:一个理论本体论上承诺于它量化所约束的变量。这一标准在当代仍被广泛讨论和修正。
七、计算机科学中的本体论
在计算机科学和信息科学中,本体论被定义为"对概念体系的明确规范说明"(Gruber, 1993)。它是一个形式化的知识表示方法,将某个领域中的概念、属性和关系以机器可读的方式进行编码。
7.1 哲学到计算机的演变
哲学本体论追问"什么存在",而计算机科学中的本体论则关注"如何在系统中组织知识"。这一转变始于20世纪80年代的人工智能研究,当时研究者意识到需要一种方式来让计算机"理解"领域知识,而不仅仅是处理数据。
7.2 本体论的组成要素
- 类(Classes/Concepts):领域中的核心概念,如"人"、"疾病"、"药物"
- 属性(Properties/Attributes):类的特征,如"年龄"、"症状"
- 关系(Relations):类之间的关联,如"治疗"(药物-疾病)、"属于"(实例-类)
- 实例(Instances/Individuals):类的具体成员,如"阿司匹林"是"药物"类的一个实例
- 公理(Axioms):约束条件和逻辑规则,用于推理
7.3 描述逻辑(Description Logic)
描述逻辑是一阶逻辑的可判定片段,构成了 OWL 等语义网语言的逻辑基础。它在表达能力和计算复杂性之间取得了平衡,使得自动推理成为可能。
八、语义网与 OWL
8.1 语义网技术栈
Tim Berners-Lee 提出的语义网愿景旨在让网络数据具有机器可理解的语义。其核心技术栈自下而上包括:
- RDF(资源描述框架):以三元组(主体-谓词-客体)形式表示数据
- RDFS(RDF Schema):提供基本的词汇表描述能力(类、属性、子类关系)
- OWL(Web Ontology Language):W3C 推荐的本体语言,提供丰富的知识表示能力
- OWL 2:OWL 的增强版,基于 OWL 2 DL(基于 SROIQ 描述逻辑)
8.2 OWL 的优势
OWL 在生成式 AI 的知识表示和语义层中展现出卓越的表现力。相比简单的关键词搜索,OWL 能够:
- 定义复杂类表达式和属性约束
- 支持自动分类和一致性检测
- 实现跨领域知识推理
- 为知识图谱提供语义层(Semantic Layer)
8.3 OWL 的三个子语言
| 子语言 | 表达能力 | 计算复杂度 | 适用场景 |
|---|---|---|---|
| OWL Lite | 最低 | 低 | 简单分类层次结构 |
| OWL DL | 中等 | 中 | 需要推理的领域知识 |
| OWL Full | 最高 | 不可判定 | 最大灵活性,放弃计算保障 |
九、知识图谱
知识图谱(Knowledge Graph)是本体论在大规模数据环境中的工程化实践。它以图结构表示实体及其关系,广泛应用于搜索引擎、智能问答、推荐系统等领域。
9.1 知识图谱的构建
- 知识获取:从结构化数据、半结构化数据(表格)和非结构化数据(文本)中提取实体和关系
- 知识融合:将来自不同来源的知识进行整合,解决实体消歧和冲突
- 知识推理:基于已有知识推导隐含事实
- 知识存储:使用 RDF 三元组存储或图数据库进行管理
9.2 本体论在知识图谱中的作用
本体论为知识图谱提供了模式层(Schema Layer),定义了概念之间的层次关系和约束条件。这使得知识图谱不仅能存储事实,还能理解和推理事实之间的语义联系。在 2026 年的 AI 系统中,本体论与知识图谱结合使用,为大型语言模型提供上下文图和语义层,显著提升了 AI 的推理能力和回答质量。
9.3 语义推理
基于本体的推理使得知识图谱能够自动推断新的知识。例如,如果本体定义了"所有哺乳动物都是动物"且"猫是哺乳动物",推理机可以自动推断"猫是动物"。这种推理能力对于自动化的知识发现和质量保障至关重要。
十、生物医学应用
生物医学领域是本体论应用最成功的领域之一。多个重要的生物医学本体论被广泛使用:
10.1 Gene Ontology (GO)
基因本体论是生物学领域最著名的本体论项目之一,于2000年发表在 Nature Genetics 上。它提供了跨物种、跨数据库的基因功能标准化表示框架,包含三个独立的本体:分子功能(Molecular Function)、生物过程(Biological Process)和细胞组分(Cellular Component)。
10.2 SNOMED CT
SNOMED CT 是最全面的生物医学本体论,涵盖广泛的生物医学和临床实体,包括体征、症状、疾病、手术和社会环境。它以有向无环图(DAG)的形式组织,实体通过 is-a 关系(子类关系)和属性关系(如 finding site)连接。随着 SNOMED CT 越来越多地被整合到电子健康记录(EHR)系统中,它在医疗互操作性中发挥着关键作用。
10.3 OBO Foundry 本体论
OBO Foundry 是一组互操作的本体论集合,包括:
- 人类表型本体论(HPO):描述人类表型异常的知识库
- Mondo 疾病本体论:整合多种疾病分类系统
- Uber-解剖本体论(Uberon):跨物种解剖学本体论
- 细胞本体论(CL):细胞类型分类
- 蛋白质本体论(PRO):蛋白质及其变体
- 疫苗本体论(VO):疫苗相关概念
10.4 本体论与 AI 在医疗中的融合
本体论作为人工智能与医疗保健之间的语义桥梁,使结构化知识框架能够增强数据互操作性和 AI 模型的准确性。SNOMED2Vec 等词嵌入模型利用本体论来增强机器定义的关系,在复杂医学关系(如"乳腺+腺癌→浸润性导管癌")的建模上超越了不基于本体论的模型。
十一、AI 与大语言模型
11.1 本体论与大语言模型(LLM)
在大语言模型时代,本体论的作用非但没有减弱,反而变得更加重要。LLM 擅长生成流畅的文本,但在知识准确性、推理一致性和领域专业性方面仍存在局限。本体论为 LLM 提供了:
- 结构化知识约束:确保生成内容符合领域知识体系
- 推理框架:提供逻辑推理的基础,弥补 LLM 的推理不足
- 术语标准化:统一领域术语,减少歧义和幻觉
- 检索增强(RAG):为本体感知的检索增强生成提供索引结构
11.2 上下文图与语义层
在 2026 年的 AI 架构中,本体论与上下文图(Context Graphs)和语义层(Semantic Layers)结合,为 AI 系统提供结构化的知识背景。这种混合方法——结合 LLM 的生成能力和本体论的结构化推理——被认为是构建可信 AI 系统的关键路径。
11.3 本体论在生成式 AI 中的前景
OWL 等本体语言在生成式 AI 的知识表示中展现出独特优势。通过将本体论与 RAG(检索增强生成)结合,AI 系统能够在保持生成灵活性的同时,确保输出内容的准确性和可追溯性。这种方法在医疗、法律、金融等高风险领域尤为重要。
参考文献
- Ontology - Wikipedia:哲学本体论的全面概述,涵盖存在、范畴、实在论等核心概念。
- History of Ontology - Wikipedia:本体论从古希腊到现代的发展历史。
- Categories - Stanford Encyclopedia of Philosophy(2004/2022):范畴系统的哲学分析。
- Aristotle's Categories - Stanford Encyclopedia of Philosophy(2007/2021):亚里士多德范畴论的详细解读。
- Logic and Ontology - Stanford Encyclopedia of Philosophy(2004/2023):逻辑与本体论的交叉问题。
- Ontological Commitment - Stanford Encyclopedia of Philosophy:本体论承诺的概念与分析。
- Ontology and Metaontology: A Contemporary Guide — Francesco Berto & Matteo Plebani, Bloomsbury Academic (2015):当代本体论与元本体论指南。
- Ontological Categories - PhilPapers:本体论范畴的文献综述。
- Exploring Ontology: A Comprehensive Overview - Philosophos:本体论综合概述。
- 海德格尔对亚里士多德范畴的存在论诠释 — 朱清华:海德格尔对亚里士多德范畴学的存在论解读。
- 亚里士多德从自然哲学到形而上学哲学的转变 — 知乎专栏:亚里士多德的存在论理性。
- 亚里士多德与海德格尔——一个存在论的比较研究 — 山东大学希腊研究中心(2019)。
- 张旭:论海德格尔的"存在论差异" — 搜狐:传统形而上学与海德格尔的存在论对比。
- 探析海德格尔的前期存在之思——基于《存在与时间》视角 — 汉斯出版社。
- 秦际明:形上与本体的相逢——中国形而上学建构的历史与问题 — 儒家中国(2022)。
- Contemporary Debates in Metaphysics — Theodore Sider, John Hawthorne, Dean W. Zimmerman (eds.), Blackwell (2007):当代形而上学争论。
- Contemporary Debates in Metaphysics (PDF):当代形而上学争论全文。
- Ontology - PhilPapers:哲学本体论概述,涵盖哲学本体论与信息系统本体论的桥梁。
- The Debate over the Subject Matter of Metaphysics:形而上学研究对象的争论,涵盖从古代到二十世纪的本体论历史。
- Why OWL Leads in Knowledge Representation and Semantic Layers — data.world (2024.9):OWL 在知识表示中的优势。
- OWL - Semantic Web Standards - W3C:W3C OWL 语义网标准官方文档。
- Introduction to Ontologies — GeeksforGeeks (2025.8):本体论入门介绍。
- Ontology and Information Systems — Stanford Encyclopedia of Philosophy (2026.1):本体论与信息系统。
- Knowledge Representation and Reasoning on the Semantic Web — Ian Horrocks & Bijan Parsia:语义网上的知识表示与推理。
- Ontologies: From Philosophy to Computing — Medium (2025.5):从哲学到计算的本体论演变。
- Knowledge Representation and Ontologies — Springer:计算机科学系统中的本体论概述。
- What Is Ontology in AI? Enterprise Guide for 2026 — Atlan (2026.1):AI 中的本体论企业指南。
- Ontology Reasoning in Knowledge Graphs — Giuseppe Futia, TDS Archive (2024.11):知识图谱中的本体论推理。
- From Facts to Knowledge: The Layer Cake of RDFS and OWL — Bryon Jacob (2025.7):从事实到知识的 RDFS 和 OWL 分层架构。
- A Survey on Knowledge Graphs: Representation, Acquisition and Applications — Shaoxiong Ji et al.:知识图谱综述。
- Knowledge Graphs, Description Logics and Reasoning on Data — Camille Bourgaux, Michaël Thomazo:知识图谱、描述逻辑与数据推理。
- Biomedical Ontologies to Guide AI Development in Radiology — PMC (NIH):引导放射学 AI 发展的生物医学本体论。
- Ontologies as the semantic bridge between artificial intelligence and healthcare — PMC:本体论作为 AI 与医疗保健之间的语义桥梁。
- Use of SNOMED CT in Large Language Models: Scoping Review — JMIR Medical Informatics (2024):SNOMED CT 在大语言模型中的应用范围综述。
- Ontologizing health systems data at scale — npj Digital Medicine (2023):大规模健康系统数据的本体论化。
- Escaping the forest: a sparse, interpretable, and foundational neural architecture — Nature (2025):使用基因本体论定义神经网络可解释架构。
- Information Content-Based Gene Ontology Semantic Similarity — PMC:基于信息内容的基因本体论语义相似性度量。
- Ontologies and Data Management: A Brief Survey — Thomas Schneider, Mantas Šimkus, KI (2020):本体论与数据管理综述。
- A guide to ontology, epistemology, and philosophical perspectives:跨学科研究中的本体论、认识论指南。
- Contemporary Debates in Metaphysics — Wiley-Blackwell (2013)。