写点什么

Nuxeo 推出 Fise 语义引擎

  • 2010-09-21
  • 本文字数:1432 字

    阅读完需:约 5 分钟

Nuxeo 的员工博客最近介绍了由 NUXEO 贡献的开源 RESTful 语义引擎 Fise (Furtwangen IKS 语义引擎)。Fise 旨在“为开发人员提供一个可重用的 HTTP 语义服务堆栈,以便在 CMS 中添加风行的语义功能”。Fise 是 IKS (交互式知识堆栈)的一部分,IKS 通过提供语义 Web 功能的方式,使 CMS 得到增强。

“语义引擎”采用非结构化的输入(比如文本文件),生成可搜索的目录和索引,并以此作为提取“有意义”的输入信息的手段。举例来说,语义引擎通常可以(通过语言或主题)对文档进行分类;具备推荐标签;还可以提取名称、地点、日期等已知的条目。使用这种分类信息,引擎还能对文档进行排序、链接到相关文档,也可以进行断言(例如,“X 公司于某日以多少钱收购了 Y 公司”)。内容管理系统涉及的主要内容是文本的创建、持久化和组织(大多数情况是多媒体文本),所以集成语义引擎能给内容的搜索和组织带来明显的优势。内容管理系统主要设计用来记录企业内部生成、使用的文档,组织、管理构成复杂站点的所有“文档”(网 页)。要为每个网页创建“语义 Web”,需要做的一件事就是将语义引擎生成的分类、索引数据纳入进来。

Open Calais Zemanta Evri 都是语义引擎的范例,它们都能通过 Web API 使用,可用来对网页和网站进行语义标注。此类语义引擎的鼻祖是 IZE ,早在 1988 年,IZE 就由坐落在威斯康星州麦迪逊市的小公司 Persoft 开发并销售了。

Olivier Grisel 是 Nuxeo 博客的作者,他总结了语义标注出现的根本原因:

对大部分内容驱动的应用(比如在线网站)或私有局域网来说,将内容条目链接到开放通用数据库(像 DBpedia、Freebase、NY Times 数据库)中定义的语义实体和主题,可以分享共有的概念框架、提升可检索性和互操作性。

发布者可以利用该技术建立自动更新的实体中心,把特定语义实体相关的各种资源(文档、日历事件、人物、组织等)聚集起来,特定的语义实体由涵盖所有应用的无歧义通用标识符确定。

Fise 提供三种基本的 HTTP 服务,它们被定义为端点:

Fise 提供引擎、存储、SPARQL 三种 HTTP 端点: - 引擎端点允许用户分析英文文本的内容,不用在服务器上存储任何内容就可以将分析结果发送回去:这是无状态的 HTTP 服务。

  • 存储端点可以进行同样的分析,而且会把结果保存在 Fise 服务器上:这是有状态的 HTTP 服务。然后后续的浏览就可以使用分析结果了。
  • SPARQL 端点提供机器级访问,以执行复杂的图形查询,去查询那些从发送到存储端点的内容条目中提取出来的增强信息。

对那些想手动测试引擎功能、使用浏览器浏览结果的人来说,这些服务可以直接通过“一个 Web 用户界面”访问,“这是个演示模式”。“对于机器(例如 Nuxeo DM、Nuxeo DAM 等第三方的 ECM 应用)来说,使用 Fise 的第二种方式就是 RESTful API,这些机器把 Fise 作为 HTTP 服务来使用,以增强文档内容”。

组织和个人现在都发现,他们正被庞大的信息所淹没,这些信息主要是非结构化的文档;而且他们必须不停地处理这些信息。这就是人们对具备语义引擎增强技术的内容管理系统和 CMS 越来越感兴趣的原因。Nuxeo 本身是 CMS 服务供应商,现在正计划在产品线中集成 Fise。

Fise 目前还是个独立的 HTTP 服务,有基本的 Web 接口,主要用于演示。要让它真正有用,还需要将它和 Nuxeo 平台结合起来,以便 Nuxeo DM、Nuxeo DAM 以及 Nuxeo CMF 的用户能从无缝的语义体验中获益。

你和你的组织将 CMS 利用到何种程度了呢?你发现在内容里添加语义标注有什么好处呢?

查看英文原文: Nuxeo Introduces fise Semantic Engine

2010-09-21 10:532130
用户头像

发布了 151 篇内容, 共 68.5 次阅读, 收获喜欢 18 次。

关注

评论

发布
暂无评论
发现更多内容

腾讯T4架构师:刷3遍以下面试题,你也能从小公司成功跳到大厂

Java架构之路

Java 程序员 架构 面试 编程语言

规模化敏捷框架何从入手?这篇文章把SAFe讲透了!

华为云开发者联盟

敏捷开发 框架 safe

假冒、诈骗、隐私安全,如何应对数字人民币的风险与挑战?

CECBC

货币

使用 Helmfile 解放你的 Helm Chart

郭旭东

云原生 Helm

职业规划

Albert

职业规划 七日更

转型项目经理?

escray

面试 面经 七日更 十日谈

JVM 的运行时数据区域分布

rookiedev

Java JVM

低代码与零代码工具的这些特征,弥补了所有人和IT之间的差距!

J2PaaS低代码平台

程序员 互联网 开发者 软件开发 开发工具

如何成为架构师?

xcbeyond

个人成长 架构师 七日更

TypeScript | 第三章:函数、泛型和枚举

梁龙先森

typescript 编程 大前端 七日更

关于昆明市政协、市统战部、民革昆明市委赴云南坤艮盈科技有限公司(商务部CECBC区块链专委会秘书处云南办事处)调研指导工作

CECBC

云南发展

FastAI:滴普技术荟:某工业产品内部结构尺寸图像测量和缺陷检测分析

AI 目标检测 图像处理 缺陷检测 图像检测

比特币的安全性到底有多高?

CECBC

比特币

FastAI:滴普技术荟:基于机器视觉的典型多目标追踪算法应用实践

目标追踪 目标检测 追踪算法

用大白话给你解释Zookeeper的选举机制

爱笑的架构师

zookeeper ZooKeeper原理 七日更

区块链矿机挖矿系统开发软件技术

LeetCode题解:92. 反转链表 II,迭代,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

彩色的线,数据的诗,你好——贵州鲲鹏!

脑极体

“社恐”独处好去处:无人自习室,一个人的“世外桃源”

IoT云工坊

物联网 无人自习室 智能门禁 智能灯控 线上预约

wildfly 21的domain配置

程序那些事

程序那些事 wildfly wildfly21 配置管理 domain模式

区块链农场游戏系统开发软件定制

Ribbon使用及其内核原理剖析

Fox666

远见而明察近观若明火|Centos7.6环境基于Prometheus和Grafana结合钉钉机器人打造全时监控(预警)Docker容器服务系统

刘悦的技术博客

Docker 高可用 监控 Prometheus 预警

数据为墨,智能作笔:画一卷新姑苏繁华图

脑极体

Nginx常见典型故障|Linux干货

赖猫

c++ nginx Linux

让你的简历不落窠臼,精雕细镂写一份真正的技术简历(Python向)

刘悦的技术博客

Python 面试 简历优化 简历

FastAI:滴普技术荟:基于深度学习的云边一体化OLED屏缺陷自动光学检测技术

学习 缺陷检测 云边一体 自动光学检测

[git使用技巧] git提交忽略不必要的文件或文件夹

xcbeyond

git 七日更

业务中台建设 - 配置化

孝鹏

中台 微服务 配置化开发

Java 细粒度锁续篇

rookiedev

Java 多线程 加锁

SQL优化最干货总结-MySQL「2020年终总结版」

Java架构师迁哥

Nuxeo推出Fise语义引擎_Java_Dave West_InfoQ精选文章