信息抽取在知识图谱构建中的实践与应用

2020 年 9 月 13 日

信息抽取在知识图谱构建中的实践与应用

编者按
坦率地讲,各行各业对如何落地知识图谱这个问题,或多或少都心存一丝疑惑。人类知识和机器可理解的知识有什么区别?知识图谱如何突破自身局限性,从“万事通”转为“科学家”?百分点认知智能实验室在实践探索中,通过利用自然语言处理技术获取结构化的信息抽取能力,探索出了一套行业知识图谱构建流程方法。尤其是基于深度迁移学习,帮助构建法律百科词条、公安文本知识图谱等行业项目中,在实体抽取、关系抽取、事件抽取等方面都取得了理想的实践效果。本文将从概念辨析、技术路径、实践总结,由虚到实、由浅入深引导大家理性看待知识图谱技术的能与不能,以更好地在实践中运筹帷幄。

本文作者:陈肇江、王勋、陈旭、吴永科、苏海波

信息抽取、知识

图谱及自然语言处理

1. 信息抽取的内涵与外延

新基建的大潮涌中,人工智能、大数据与 5G 应用是人们竞相追逐的灯塔,在描绘数字经济时代宏伟蓝图的时候,知识图谱与自然语言处理成为追捧的香饽饽。

如何从海量的文本或网页的原始数据中提取有价值的信息是行业知识图谱构建的关键因素,信息抽取 (Information Extraction,IE) 作为自然语言处理技术的任务,该任务的重点在于从机器可读取的非结构化或半结构化的文本中抽取信息,最终以结构化的形式进行描述,使信息可以存入数据库以供进一步处理。

原文链接:【 https://www.infoq.cn/article/ii4Efiu5rJB2Jls8QmDI 】。未经作者许可,禁止转载。

登录后可解锁全站优质内容

免费畅享技术公开课、顶尖技术团队访谈、一线互联网大厂技术实践

文章
视频
电子书
研究报告
立即登录
2020 年 9 月 13 日 14:00 1107

评论

发布
暂无评论
发现更多内容

众安黑客马拉松大赛总决赛-InfoQ小编探班

众安黑客马拉松大赛总决赛-InfoQ小编探班

信息抽取在知识图谱构建中的实践与应用-InfoQ