【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

语义网与本体论技术继续成长

  • 2008-05-05
  • 本文字数:1587 字

    阅读完需:约 5 分钟

随着企业架构在各种组织中扎根,各种本体论和相关的管理正日渐盛行。现在已经出现了相应的工具支持,语义及本体论的概念也得到了更充分的理解。越来越多的参与者在这个领域做出他们的贡献。AKSW 研究组最近发布了他们的Triplify 产品,“为万维网的‘语义化’提供建筑单元”。还有 UMBEL 基干项目开始为万维网提供轻量级 的主体结构。Dan McCreary 也讨论了开发和维护企业本体论架构过程中容易遇到的一些主要陷阱

The Agile Knowledge and Semantic Web 研究组(ASKW)最近发布了 Triplify 产品的新版本。Triplify 是一种小型的 Web 应用插件,它能够以 RDF、JSON 或者 Linked Data 格式提供数据库的内容,揭示出关系数据库中所保存的数据的语义结构。通过 Triplify 插件和在查询中调整数据列,Triplify 可以分析查询所返回的数据,并以前面提到的格式对外提供数据。Triplify 有利于中小型的 Web 应用参与到语义网中来,因为不需要为建立和维护大规模的语义定义而付出大量的努力。Triplify 的终极目标是“开拓 Web 应用背后的结构化的关系表示(representations),让万维网上的语义表示达到临界质量。”

Upper Mapping and Bind Exchange Layer(UMBEL)项目宣称自己是“轻量级的本体论,通过一组标准的主体概念(subject concepts)将万维网上的数据彼此联系起来”。UMBEL 将“主体概念(subject concepts)”定义为:

主体概念是一个明确的概念子集,来源是一些得到广泛理解的概念,包括 SKOS RDFS 词汇集、形式概念分析以及在一些上级本体论中非常通用的概念。主体概念是一类特殊的概念:它们是具体的、与主体相关的、非抽象的。它们与命名实体形成更鲜明的对照,命名实体是真实的事物,是主体概念类在真实世界中的实例。

UMBEL 项目的要旨,是为无穷无尽的、细粒度的、局部的本体论和概念映射之间的关系提供“元映射”。 Michael K. Bergman 给出了万维网主体基干的示意图,还制作了一组幻灯片来阐释 UMBEL 的在线例子和该项目的 11 个语义 Web Service

最后 Dan McCreary 讨论了定义企业本体论的时候需要注意的一些事项。当被问到企业在定义自己的本体论时会遇到哪些主要障碍,Dan 回答说“本体论”这个词本身就是一个大障碍:

这个词令很多人望而却步,他们会觉得这是高深的 AI 研究。有时候我们应该选一个更平易的名字。比如叫做“元数据注册表(metadata registry)”就令人容易接受得多。很多人在和数据库开发人员一起工作的时候把它叫做“逻辑数据模型”或者“企业数据字典”。而在 XML 行业里喜欢称之为“XML Schema 类型库”。看你的听众是什么人……选一个让听众觉得舒服的术语,把精力集中到对于企业组织真正有意义的方面。大约只有 25% 的客户我会告诉他们我在构建本体论。

当组织开始走上定义自己的本体论的正轨,需要对本体论进行管理并在整个企业中推行。Dan 说这些并不仅仅是企业上层的工作,而是需要在整个组织中展开。

上层本体论(upper ontology)本身几乎没有什么用处。它们自身并不解决实际的业务问题。只有展开到枝叶层次的元素,你才能开始把它映射到数据库的列。这个时候才算迈出长征的第一步。

当组织开始采纳本体论之后,就应该开始留心 McCreary 列出的十大陷阱了

  1. 使用专门的本体论设计工具。
  2. 避免出现重复的数据元素。
  3. 不要将角色和本体论中的对象混淆在一起。
  4. 将定义语义的过程和定义约束的过程分离开。
  5. 全面地测试上层本体论。
  6. 为数据元素制定明确的定义。
  7. 元素的定义和对元素的描述不应该混杂在一起。
  8. 建立可搜索的结构,使复杂的全文搜索成为可能。
  9. 采纳某种版本跟踪实践,实现定义的可追溯性。
  10. 对于企业中的标识符 / 代码也应该定义其语义。

McCreary 还强调应该让组织中的某个团队或个人“拥有”某个本体论,让他们为语义的精确性负责。如果企业珍惜自身的本体论的价值,应该让这些个人扮演关键的领导角色。

查看英文原文: The Semantic Web and Ontological Technologies Continue to Expand

2008-05-05 14:261316
用户头像

发布了 225 篇内容, 共 60.9 次阅读, 收获喜欢 50 次。

关注

评论

发布
暂无评论
发现更多内容

Prometheus云原生监控:运维与开发实战

方勇(gopher)

云原生 #Prometheus

获奖公布!OceanBase 第一届技术征文大赛圆满收官!

OceanBase 数据库

开发者 征文大赛 oceanbase OceanBase 开源

架构实战训练营-模块5-作业

温安适

「架构实战营」

一份简单够用的 Nginx Location 配置讲解

冴羽

nginx 后端 博客 后端开发 博客配置

盘点 2021|一个普通人的不普通的2021

慕枫技术笔记

程序人生 盘点 2021

盘点 2021|考研,裸辞——混乱中寻找秩序,2021后记

某个Coder

盘点 2021

盘点 2021 | 云原生拥抱之路

xcbeyond

程序人生 云原生 盘点2021 xcbeyond

【LeetCode】统计特殊四元组Java题解

Albert

算法 LeetCode 1月月更

ReactNative进阶(一):ReactNative 学习资料汇总

No Silver Bullet

React Native 1月月更

LabVIEW纹理分析(基础篇—9)

不脱发的程序猿

机器视觉 图像处理 LabVIEW 纹理分析

(1-2/2)AI的落地:读caoz的文章有感

mtfelix

无限生长 2022Y300P

《张汉东的 Rust 实战课》学习笔记

贾献华

C++ 动态内存分配的问题,你都懂了吗?

小梁编程汇

c++ 堆内存管理 内存分配 smart pointer

一个cpp协程库的前世今生(九)协程参数与返回值的处理

SkyFire

c++ cocpp

Flutter 让你的Dialog脱胎换骨吧!(Attach,Dialog,Loading,Toast)

小呆呆666

flutter ios android 前端 大前端

设计微博评论的高性能高可用计算架构

drizzle

「架构实战营」

Kafka原理——Kafka为何如此之快?

Kafka中文社区

(1-1/1)底层逻辑读后感:三种对错观四类表述

mtfelix

无限生长 2022Y300P

千万级学生管理系统的考试试卷存储方案

swallowluo

架构实战营 #架构实战营 「架构实战营」

世界女性科技群落(五):数字化黄金时代,东南亚女性都是隐藏的阿尔法

脑极体

架构训练营 week4 作业

红莲疾风

「架构实战营」

数据库批量插入这么讲究的么?

秦怀杂货店

Java 数据库 批量插入

03 Prometheus之架构及数据模型

穿过生命散发芬芳

Prometheus 1月月更

川大记忆

wood

300天创作 川大

【新年互动搞起!】元旦快乐!这里是2022年的 OceanBase

OceanBase 数据库

开发者 OceanBase 社区版 2022年新年祝福 元旦

hw8-设计消息队列存储消息数据的MySQL表格

WWH

架构实战营

分布式系统必知必会

小梁编程汇

分布式 分布式系统 共识算法 分布式通信算法 #raft

写时复制技术(COW)详解

小梁编程汇

性能优化 操作系统 CopyOnWrite;

Go 通过 Map/Filter/ForEach 等流式 API 高效处理数据

万俊峰Kevin

微服务 stream go-zero Go 语言

面试官:为什么不同返回类型不算方法重载?

王磊

首次!中西方数据库大咖“时空对话”,为中国分布式数据库开发者大会打call

OceanBase 数据库

OceanBase 开源 OceanBase 社区版 开发者大会

语义网与本体论技术继续成长_SOA_Steven Robbins_InfoQ精选文章