写点什么

Nuxeo 推出 Fise 语义引擎

  • 2010-09-21
  • 本文字数:1432 字

    阅读完需:约 5 分钟

Nuxeo 的员工博客最近介绍了由 NUXEO 贡献的开源 RESTful 语义引擎 Fise (Furtwangen IKS 语义引擎)。Fise 旨在“为开发人员提供一个可重用的 HTTP 语义服务堆栈,以便在 CMS 中添加风行的语义功能”。Fise 是 IKS (交互式知识堆栈)的一部分,IKS 通过提供语义 Web 功能的方式,使 CMS 得到增强。

“语义引擎”采用非结构化的输入(比如文本文件),生成可搜索的目录和索引,并以此作为提取“有意义”的输入信息的手段。举例来说,语义引擎通常可以(通过语言或主题)对文档进行分类;具备推荐标签;还可以提取名称、地点、日期等已知的条目。使用这种分类信息,引擎还能对文档进行排序、链接到相关文档,也可以进行断言(例如,“X 公司于某日以多少钱收购了 Y 公司”)。内容管理系统涉及的主要内容是文本的创建、持久化和组织(大多数情况是多媒体文本),所以集成语义引擎能给内容的搜索和组织带来明显的优势。内容管理系统主要设计用来记录企业内部生成、使用的文档,组织、管理构成复杂站点的所有“文档”(网 页)。要为每个网页创建“语义 Web”,需要做的一件事就是将语义引擎生成的分类、索引数据纳入进来。

Open Calais Zemanta Evri 都是语义引擎的范例,它们都能通过 Web API 使用,可用来对网页和网站进行语义标注。此类语义引擎的鼻祖是 IZE ,早在 1988 年,IZE 就由坐落在威斯康星州麦迪逊市的小公司 Persoft 开发并销售了。

Olivier Grisel 是 Nuxeo 博客的作者,他总结了语义标注出现的根本原因:

对大部分内容驱动的应用(比如在线网站)或私有局域网来说,将内容条目链接到开放通用数据库(像 DBpedia、Freebase、NY Times 数据库)中定义的语义实体和主题,可以分享共有的概念框架、提升可检索性和互操作性。

发布者可以利用该技术建立自动更新的实体中心,把特定语义实体相关的各种资源(文档、日历事件、人物、组织等)聚集起来,特定的语义实体由涵盖所有应用的无歧义通用标识符确定。

Fise 提供三种基本的 HTTP 服务,它们被定义为端点:

Fise 提供引擎、存储、SPARQL 三种 HTTP 端点: - 引擎端点允许用户分析英文文本的内容,不用在服务器上存储任何内容就可以将分析结果发送回去:这是无状态的 HTTP 服务。

  • 存储端点可以进行同样的分析,而且会把结果保存在 Fise 服务器上:这是有状态的 HTTP 服务。然后后续的浏览就可以使用分析结果了。
  • SPARQL 端点提供机器级访问,以执行复杂的图形查询,去查询那些从发送到存储端点的内容条目中提取出来的增强信息。

对那些想手动测试引擎功能、使用浏览器浏览结果的人来说,这些服务可以直接通过“一个 Web 用户界面”访问,“这是个演示模式”。“对于机器(例如 Nuxeo DM、Nuxeo DAM 等第三方的 ECM 应用)来说,使用 Fise 的第二种方式就是 RESTful API,这些机器把 Fise 作为 HTTP 服务来使用,以增强文档内容”。

组织和个人现在都发现,他们正被庞大的信息所淹没,这些信息主要是非结构化的文档;而且他们必须不停地处理这些信息。这就是人们对具备语义引擎增强技术的内容管理系统和 CMS 越来越感兴趣的原因。Nuxeo 本身是 CMS 服务供应商,现在正计划在产品线中集成 Fise。

Fise 目前还是个独立的 HTTP 服务,有基本的 Web 接口,主要用于演示。要让它真正有用,还需要将它和 Nuxeo 平台结合起来,以便 Nuxeo DM、Nuxeo DAM 以及 Nuxeo CMF 的用户能从无缝的语义体验中获益。

你和你的组织将 CMS 利用到何种程度了呢?你发现在内容里添加语义标注有什么好处呢?

查看英文原文: Nuxeo Introduces fise Semantic Engine

2010-09-21 10:531878
用户头像

发布了 151 篇内容, 共 64.8 次阅读, 收获喜欢 18 次。

关注

评论

发布
暂无评论
发现更多内容

Flink+Alink,当大数据遇见机器学习!

博文视点Broadview

云上创新,阿里云视频云分享全场景音视频服务背后的场景探索与技术实践

阿里云CloudImagine

阿里云 音视频 在线教育 视频会议 直播技术

国内首篇云厂商 Serverless 论文入选全球顶会:突发流量下,如何加速容器启动?

Serverless Devs

Serverless 容器 云原生

毕业设计So Easy:珠穆朗玛FM音频电台APP

不脱发的程序猿

android 软件开发 APP开发 毕业设计 移动应用开发

华为云携手马栏山文创园助力湖南广电荣获国家广电总局多项大奖

华为云开发者联盟

AI 5G 视频 华为云 马栏山

我把 Spring Boot 项目从 18.18M 瘦身到 0.18M,部署起来真省事!

xcbeyond

微服务 springboot 6月日更

TCP协议

IT视界

TCP 传输协议 网络通信

从零开始学习3D可视化之控制对象(1)

ThingJS数字孪生引擎

物联网 可视化 3D 3D可视化 数字孪生

🏆未来可期,WebRTC成为实时通讯方案的行业标准

码界西柚

音视频 WebRTC 实时通信 6月日更

架构实战营模块五作业

竹林七贤

【LeetCode】你能在你最喜欢的那天吃到你最喜欢的糖果吗?Java题解

Albert

算法 LeetCode 6月日更

架构实战营 - 模块 5- 作业

carl

奇亚Chia挖矿系统开发方案丨奇亚Chia挖矿源码功能

系统开发咨询1357O98O718

LeaRun .Net Core/Java工作流引擎,分离式前端,升级Vue

雯雯写代码

Vue 工作流引擎

一封MySQL之父Monty的回信,开启彭立勋的数据库之路

华为云开发者联盟

MySQL 数据库 opengauss GaussDB 华为云数据库

面向对象的Python编程,你需要知道这些!

华为云开发者联盟

Python 面向对象 oop 面向对象编程

写给想做程序员的半吊子应届毕业生们

北游学Java

Java Python 求职 秋招

Tapdata 实时数据融合平台解决方案(一):现代企业数据架构及痛点

tapdata

mongodb

anyRTC SDK 5月迭代:优化自定义加密功能,让通信更安全

anyRTC开发者

音视频 WebRTC sdk

Chia奇亚云算力挖矿系统开发成功案例丨Chia奇亚挖矿源码成品

系统开发咨询1357O98O718

AT智能量化炒币机器人系统开发详解案例

系统开发咨询1357O98O718

Tapdata 实时数据融合平台解决方案(二):理解数据中台

tapdata

oracle mongodb

带你认识大模型训练关键算法:分布式训练Allreduce算法

华为云开发者联盟

分布式训练 Allreduce算法 集合通信 分布式通信算法 大模型训练

我的树莓派居然偷偷的学会了日语

IT蜗壳-Tango

IT蜗壳教学 6月日更

自适应微服务治理背后的算法

万俊峰Kevin

微服务 自适应 服务治理 Go 语言

fil云算力系统开发具体流程丨fil云算力开发源码成品

系统开发咨询1357O98O718

网络攻防学习笔记 Day33

穿过生命散发芬芳

网络攻防 6月日更

一文回顾 Java 入门知识(上)

逆锋起笔

Java 后端 javase

Tapdata 实时数据融合平台解决方案(三):数据中台的技术需求

tapdata

oracle mongodb

你的同事是你的竞争对手吗?

石云升

战略思考 职场经验 6月日更

【译】JavaScript 代码整洁之道-异常处理篇

KooFE

JavaScript 大前端 异常处理 6月日更 整洁代码

Nuxeo推出Fise语义引擎_Java_Dave West_InfoQ精选文章