2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Nuxeo 推出 Fise 语义引擎

  • 2010-09-21
  • 本文字数:1432 字

    阅读完需:约 5 分钟

Nuxeo 的员工博客最近介绍了由 NUXEO 贡献的开源 RESTful 语义引擎 Fise (Furtwangen IKS 语义引擎)。Fise 旨在“为开发人员提供一个可重用的 HTTP 语义服务堆栈,以便在 CMS 中添加风行的语义功能”。Fise 是 IKS (交互式知识堆栈)的一部分,IKS 通过提供语义 Web 功能的方式,使 CMS 得到增强。

“语义引擎”采用非结构化的输入(比如文本文件),生成可搜索的目录和索引,并以此作为提取“有意义”的输入信息的手段。举例来说,语义引擎通常可以(通过语言或主题)对文档进行分类;具备推荐标签;还可以提取名称、地点、日期等已知的条目。使用这种分类信息,引擎还能对文档进行排序、链接到相关文档,也可以进行断言(例如,“X 公司于某日以多少钱收购了 Y 公司”)。内容管理系统涉及的主要内容是文本的创建、持久化和组织(大多数情况是多媒体文本),所以集成语义引擎能给内容的搜索和组织带来明显的优势。内容管理系统主要设计用来记录企业内部生成、使用的文档,组织、管理构成复杂站点的所有“文档”(网 页)。要为每个网页创建“语义 Web”,需要做的一件事就是将语义引擎生成的分类、索引数据纳入进来。

Open Calais Zemanta Evri 都是语义引擎的范例,它们都能通过 Web API 使用,可用来对网页和网站进行语义标注。此类语义引擎的鼻祖是 IZE ,早在 1988 年,IZE 就由坐落在威斯康星州麦迪逊市的小公司 Persoft 开发并销售了。

Olivier Grisel 是 Nuxeo 博客的作者,他总结了语义标注出现的根本原因:

对大部分内容驱动的应用(比如在线网站)或私有局域网来说,将内容条目链接到开放通用数据库(像 DBpedia、Freebase、NY Times 数据库)中定义的语义实体和主题,可以分享共有的概念框架、提升可检索性和互操作性。

发布者可以利用该技术建立自动更新的实体中心,把特定语义实体相关的各种资源(文档、日历事件、人物、组织等)聚集起来,特定的语义实体由涵盖所有应用的无歧义通用标识符确定。

Fise 提供三种基本的 HTTP 服务,它们被定义为端点:

Fise 提供引擎、存储、SPARQL 三种 HTTP 端点: - 引擎端点允许用户分析英文文本的内容,不用在服务器上存储任何内容就可以将分析结果发送回去:这是无状态的 HTTP 服务。

  • 存储端点可以进行同样的分析,而且会把结果保存在 Fise 服务器上:这是有状态的 HTTP 服务。然后后续的浏览就可以使用分析结果了。
  • SPARQL 端点提供机器级访问,以执行复杂的图形查询,去查询那些从发送到存储端点的内容条目中提取出来的增强信息。

对那些想手动测试引擎功能、使用浏览器浏览结果的人来说,这些服务可以直接通过“一个 Web 用户界面”访问,“这是个演示模式”。“对于机器(例如 Nuxeo DM、Nuxeo DAM 等第三方的 ECM 应用)来说,使用 Fise 的第二种方式就是 RESTful API,这些机器把 Fise 作为 HTTP 服务来使用,以增强文档内容”。

组织和个人现在都发现,他们正被庞大的信息所淹没,这些信息主要是非结构化的文档;而且他们必须不停地处理这些信息。这就是人们对具备语义引擎增强技术的内容管理系统和 CMS 越来越感兴趣的原因。Nuxeo 本身是 CMS 服务供应商,现在正计划在产品线中集成 Fise。

Fise 目前还是个独立的 HTTP 服务,有基本的 Web 接口,主要用于演示。要让它真正有用,还需要将它和 Nuxeo 平台结合起来,以便 Nuxeo DM、Nuxeo DAM 以及 Nuxeo CMF 的用户能从无缝的语义体验中获益。

你和你的组织将 CMS 利用到何种程度了呢?你发现在内容里添加语义标注有什么好处呢?

查看英文原文: Nuxeo Introduces fise Semantic Engine

2010-09-21 10:532149
用户头像

发布了 151 篇内容, 共 68.8 次阅读, 收获喜欢 18 次。

关注

评论

发布
暂无评论
发现更多内容

Swagger 这一个文章就够了

陈磊@Criss

【写作群星榜】8.1~8.14 写作平台优秀作者 & 文章排名

InfoQ写作社区官方

写作平台 排行榜 热门活动

[修复 Webpack 官方 Bug] 提取CSS时的依赖图修正

分一

大前端 webpack 编译优化 源码刨析

中本聪原始比特币论文解读:点对点的电子现金系统

韩超

比特币 区块链

源码分析 | 咋嘞?你的IDEA过期了吧!加个Jar包就破解了,为什么?

小傅哥

Java 字节码插桩 asm bytebuddy

实用心理学—没用你打我!

代码制造者

职场 职场搞笑 信息技术 人工

6种快速统计代码执行时间的方法

Bruce Duan

java统计时间 currentTimeMillis nanoTime StopWatch

微服务框架-模块需求篇

superman

微服务框架 - 模块功能设计篇

superman

为什么会是Docker?

架构精进之路

Docker

芯片破壁者(十二.下):青瓦台魔咒与半导体“死亡谷”

脑极体

Serverless:为我们到底带来了什么

刘宇

Serverless 云原生

一文了解对称加密与非对称加密

我是程序员小贱

安全

重磅消息,我国数字人民币将在京津冀等具备条件地区试点

CECBC

数字货币 货币

Vue项目起步

JackWangGeek

Vue

从实际案例讲 Deno 的应用场景

keelii

Java typescript deno

Windows AD 保姆级配置NTP服务器教程

BigYoung

时间 AD ntp Windows Server 2012 R2

从北京降雨的复盘中,我发现了企业SD-WAN网络的秘密

脑极体

NetPerf揭示容器间是高速路还是林荫小路

陈磊@Criss

微博基于 Flink 的机器学习实践

Apache Flink

flink

2.3.1 理解动态代理 -《SSM深入解析与项目实战》

谙忆

2.3.2 JDK动态代理 -《SSM深入解析与项目实战》

谙忆

图解23种设计模式——前方高能,前端切图仔请务必抓好方向盘

执鸢者

typescript 大前端 设计模式

Flink 中的应用部署:当前状态与新应用模式

Apache Flink

flink

手撕二分查找及其变种,就是干!

我是程序员小贱

非科班学习编程一定得知道这几个网站!

我是程序员小贱

Junit执行单元测试用例成功,mvn test却失败的问题和解决方法

陈磊@Criss

Facebook开源的数据Mock:Memisis详解

陈磊@Criss

用Ant实现Java项目的自动构建和部署

陈磊@Criss

LeetCode题解:88. 合并两个有序数组,splice合并数组+sort排序,JavaScript,详细注释

Lee Chen

大前端 LeetCode

Django的Models更新时,不触发Signals解决办法

BigYoung

django singals 信号机制 update 更新

Nuxeo推出Fise语义引擎_Java_Dave West_InfoQ精选文章