2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Nuxeo 推出 Fise 语义引擎

  • 2010-09-21
  • 本文字数:1432 字

    阅读完需:约 5 分钟

Nuxeo 的员工博客最近介绍了由 NUXEO 贡献的开源 RESTful 语义引擎 Fise (Furtwangen IKS 语义引擎)。Fise 旨在“为开发人员提供一个可重用的 HTTP 语义服务堆栈,以便在 CMS 中添加风行的语义功能”。Fise 是 IKS (交互式知识堆栈)的一部分,IKS 通过提供语义 Web 功能的方式,使 CMS 得到增强。

“语义引擎”采用非结构化的输入(比如文本文件),生成可搜索的目录和索引,并以此作为提取“有意义”的输入信息的手段。举例来说,语义引擎通常可以(通过语言或主题)对文档进行分类;具备推荐标签;还可以提取名称、地点、日期等已知的条目。使用这种分类信息,引擎还能对文档进行排序、链接到相关文档,也可以进行断言(例如,“X 公司于某日以多少钱收购了 Y 公司”)。内容管理系统涉及的主要内容是文本的创建、持久化和组织(大多数情况是多媒体文本),所以集成语义引擎能给内容的搜索和组织带来明显的优势。内容管理系统主要设计用来记录企业内部生成、使用的文档,组织、管理构成复杂站点的所有“文档”(网 页)。要为每个网页创建“语义 Web”,需要做的一件事就是将语义引擎生成的分类、索引数据纳入进来。

Open Calais Zemanta Evri 都是语义引擎的范例,它们都能通过 Web API 使用,可用来对网页和网站进行语义标注。此类语义引擎的鼻祖是 IZE ,早在 1988 年,IZE 就由坐落在威斯康星州麦迪逊市的小公司 Persoft 开发并销售了。

Olivier Grisel 是 Nuxeo 博客的作者,他总结了语义标注出现的根本原因:

对大部分内容驱动的应用(比如在线网站)或私有局域网来说,将内容条目链接到开放通用数据库(像 DBpedia、Freebase、NY Times 数据库)中定义的语义实体和主题,可以分享共有的概念框架、提升可检索性和互操作性。

发布者可以利用该技术建立自动更新的实体中心,把特定语义实体相关的各种资源(文档、日历事件、人物、组织等)聚集起来,特定的语义实体由涵盖所有应用的无歧义通用标识符确定。

Fise 提供三种基本的 HTTP 服务,它们被定义为端点:

Fise 提供引擎、存储、SPARQL 三种 HTTP 端点: - 引擎端点允许用户分析英文文本的内容,不用在服务器上存储任何内容就可以将分析结果发送回去:这是无状态的 HTTP 服务。

  • 存储端点可以进行同样的分析,而且会把结果保存在 Fise 服务器上:这是有状态的 HTTP 服务。然后后续的浏览就可以使用分析结果了。
  • SPARQL 端点提供机器级访问,以执行复杂的图形查询,去查询那些从发送到存储端点的内容条目中提取出来的增强信息。

对那些想手动测试引擎功能、使用浏览器浏览结果的人来说,这些服务可以直接通过“一个 Web 用户界面”访问,“这是个演示模式”。“对于机器(例如 Nuxeo DM、Nuxeo DAM 等第三方的 ECM 应用)来说,使用 Fise 的第二种方式就是 RESTful API,这些机器把 Fise 作为 HTTP 服务来使用,以增强文档内容”。

组织和个人现在都发现,他们正被庞大的信息所淹没,这些信息主要是非结构化的文档;而且他们必须不停地处理这些信息。这就是人们对具备语义引擎增强技术的内容管理系统和 CMS 越来越感兴趣的原因。Nuxeo 本身是 CMS 服务供应商,现在正计划在产品线中集成 Fise。

Fise 目前还是个独立的 HTTP 服务,有基本的 Web 接口,主要用于演示。要让它真正有用,还需要将它和 Nuxeo 平台结合起来,以便 Nuxeo DM、Nuxeo DAM 以及 Nuxeo CMF 的用户能从无缝的语义体验中获益。

你和你的组织将 CMS 利用到何种程度了呢?你发现在内容里添加语义标注有什么好处呢?

查看英文原文: Nuxeo Introduces fise Semantic Engine

2010-09-21 10:532154
用户头像

发布了 151 篇内容, 共 68.9 次阅读, 收获喜欢 18 次。

关注

评论

发布
暂无评论
发现更多内容

2023 IoTDB Summit:昆仑智汇数据科技(北京)有限公司董事长陆薇《IoTDB在先进制造领域数据资源管理运营的应用》

Apache IoTDB

据说这道Go面试题90%的人都搞错了!

王中阳Go

面试题 面经 defer Go 语言 断点

秒级响应,显著增效:明日控股携手奇点云,打造大宗贸易的数据中台标杆

极客天地

【豆瓣9.1】《大数据处理框架Apache Spark设计与实现(全彩)》PDF

程序员李木子

在线 cURL 参数对比工具,让你的开发工作更加高效

秦少卫

curl 接口工具 调试工具 请求参数对比 参数格式化

C# 面向对象编程解析:优势、类和对象、类成员详解

小万哥

C# 程序人生 编程语言 软件工程 后端开发

传统外贸和代购独立站的区别

tbapi

传统外贸 外贸独立站

小红书如何做混部?

阿里巴巴云原生

阿里云 云原生 Koordinator

【完整版教程】iOS混淆加固原理篇

一文详解全栈可观测的实现路径

阿里巴巴云原生

阿里云 云原生 可观测

【新手视频】在线快速搭建AI原生应用

AI大咚咚

百度 AI rag AI原生应用 Agent构建

【豆瓣8.4】《RabbitMQ实战指南》PDF

程序员李木子

上一任留下的 Eureka,我该如何提升她的性能和稳定性(含数据比对)?

阿里巴巴云原生

阿里云 微服务 云原生

从 Greenplum 到 Databend,万全网络数据库平台架构演进

Databend

数据库迁移

物流快递电子面单对接规则指南

快递鸟

电子面单

Nop入门:极简服务层开发

canonical

gRPC 低代码 graphql SpringBoot3

听GPT 讲Rust源代码--compiler(30)

fliter

产品经理需要掌握哪些技能?一文弄懂PM的方方面面!附知识图谱

彭宏豪95

产品经理 产品设计 PM 在线白板 团队协同

Nop入门:极简数据访问层开发

canonical

mybatis 低代码 ORM graphql

Programming Abstractions in C阅读笔记:p254-p257

codists

选择海外云手机需要考虑什么?

Ogcloud

云手机 海外云手机 云手机海外版

手把手系列!无需 OpenAI 即可搭建 RAG 应用

Zilliz

Milvus openai AIGC LLM rag

DAPP合约代币质押流动性挖矿系统开发丨源码丨技术设计

l8l259l3365

上市难不上市更难,谁能佐证中国企服的光明前途?

ToB行业头条

2024年首期OpenHarmony繁星计划师资培训在东莞圆满举办

新消费日报

Nuxeo推出Fise语义引擎_Java_Dave West_InfoQ精选文章