写点什么

谷歌 DeepMind 开源了 Aeneas,一个用于分析古代文本的 AI 模型

作者:Anthony Alford

  • 2025-08-17
    北京
  • 本文字数:1167 字

    阅读完需:约 4 分钟

大小:560.61K时长:03:11
谷歌DeepMind开源了Aeneas,一个用于分析古代文本的AI模型

谷歌DeepMind开源了Aeneas,这是一个用于理解古代铭文的生成式 AI 模型。Aeneas 能够处理文本和图像输入,并在修复受损铭文中缺失字符方面超越了其他最先进的模型。

 

Aeneas 旨在帮助历史学家进行碑文研究,即研究古代铭文。它有助于自动化几个关键任务:确定铭文的年代;识别铭文的起源地区;重建部分铭文;以及识别相似铭文,即具有相似词汇或措辞的铭文。Aeneas 使用多模态 transformer 架构作为其核心,每个任务都有专门的头部。在几个碑文任务的评估中,Aeneas 超越了最先进的 AI 模型和人类历史学家。当人类历史学家使用 Aeneas 作为这些相同任务的工具时,综合表现甚至更好。根据 DeepMind 的说法,

 

我们的模型也可以适应其他古代语言、文字和媒介,从纸莎草纸到硬币,扩展了其能力,以帮助在更广泛的历史证据中建立联系……这项工作是探索生成性 AI 如何帮助历史学家更好地识别和解释大规模相似之处的更广泛努力的一部分。我们希望这项研究能够惠及尽可能多的人,因此我们正在为研究人员、学生、教育工作者、博物馆专业人士等提供免费的 Aeneas 互动版本……

 

Aeneas 基于 DeepMind 的Ithaca项目构建,Ithaca 是一个纯文本模型,训练用于对古希腊文本进行碑文研究。Aeneas 增加了对图像输入的支持。Aeneas 还可以恢复未知数量缺失字符的铭文以及输出相似之处,这些是 Ithaca 所缺乏的。

 

为了训练模型,DeepMind 组装了拉丁铭文数据集(LED),一个包含 176,861 个铭文的语料库。他们从现有的源数据集开始,然后创建了一个“复杂的流程”来清理记录,并将它们合并为单一格式。这些数据包含从公元前 7 世纪到公元 8 世纪的铭文,来自从英国到美索不达米亚到罗马世界的各个地区。

 

为了评估其作为研究工具的有效性,DeepMind 与 23 位碑文专家开展了一项研究,这些专家在有时间限制的情况下使用 Aeneas“模拟现实世界的研究工作流程”。人类专家手动选择了相似的铭文,但通常也会至少包含一个由 Aeneas 建议的额外选项。一位研究人员声称:

 

Aeneas 检索到的相似之处完全改变了我对历史的关注……如果让我自己找这些文本,可能需要几天时间,而不是 15 分钟。如果我根据这些铭文的解读来进行历史解读,现在我将有几天的时间来撰写和构建研究问题,而不是寻找相似之处。

 

在 Hacker News 上关于Aeneas的讨论中,一位用户写道:

 

对我来说,这些只是基于现有信息的合理推测,因此无论何时使用这个工具,都需要加上免责声明。话虽如此,许多(古代)历史都是基于部分信息的合理推测。即使我们拥有大量可用的文字资料,比如西塞罗的作品,我们也必须承认,我们是从某个特定视角来看待这些事件的,而这个视角是由个人偏见和动机决定的。因此,我们试图根据存在一定“数据质量问题”的数据来推断历史上发生的事情。

 

Aeneas的代码可以在 GitHub 上找到。还有一个Aeneas互动演示网站

 

原文链接:

https://www.infoq.com/news/2025/08/google-deepmind-aeneas/

2025-08-17 16:006077

评论

发布
暂无评论
发现更多内容

Docker搭建项目环境实战

书旅

Docker Dockerfile Docker-compose

完了,这个硬件成精了,它竟然绕过了 CPU

简爱W

Flink水位线和时间戳理解-7

小知识点

scala 大数据 flink 模块化流程

你可能需要一个脱机状态

非著名程序员

学习 程序员 个人成长 工作方式

介绍一款API敏捷开发工具

棒锤🐮

敏捷开发 Rocket API API敏捷开发

十一周作业

olderwei

极客大学架构师训练营

前端分页组件实现逻辑

书旅

php 大前端 分页

【解Bug之路】——Nginx 502 Bad Gateway

简爱W

POI 之 策略游戏

zhoo299

随笔杂谈

Spring Boot 集成 Sharding-JDBC + Mybatis-Plus 实现分库分表

简爱W

你可能不知道的计算机基础

书旅

c 常量 计算机 基础

大数据技术思想入门(四):分布式文件的元数据是怎么存储的

cristal

Java 大数据 hadoop 分布式

视频码控:CBR、VBR和ABR

潇湘落木

直播 SRS 视频编码 码控

LeetCode题解:26. 删除排序数组中的重复项,双指针,JavaScript,详细注释

Lee Chen

大前端 LeetCode

week 11学习总结

Geek_2e7dd7

让理性思维走进我们的生活,帮助我们做出更好的决策。

叶小鍵

心理学 基思. 斯坦诺维奇 超越智商 认知科学

Linux系统监控工具推荐

wangkx

监控 工具软件

week 11

Geek_2e7dd7

Postman生成接口文档

书旅

Postman 接口文档

不想做经理的程序员

escray

学习 面试

一个快捷方便的油煎鸡胸肉,懒人标配香喷喷好吃看得见

小霸王其乐无穷

美食 鸡胸肉 懒人

融云 X- Meetup 技术沙龙广州站:全球通信云技术实践分享

InfoQ_967a83c6d0d7

请不要随便修改基类

架构师修行之路

SQL查询语句执行顺序详解

书旅

MySQL SQL语法 sql查询

数据库是咋工作的?

简爱W

图解javascript——基础篇(以思维导图总结js中关键技术点,为面试及工作助力)

执鸢者

Java 大前端

「零代码」搭建简易招聘管理系统

Tony Wu

效率工具 SaaS 招聘管理 HRIS

Docker 最常用的镜像命令和容器命令

哈喽沃德先生

Docker 容器 微服务

Redis 之父关于 CRC64 的神秘往事!

yes

redis CRC

战斗还是逃避,或许可以考虑一下合作?

escray

学习 面试

Netty之旅二:口口相传的高性能Netty到底是什么?

一枝花算不算浪漫

谷歌DeepMind开源了Aeneas,一个用于分析古代文本的AI模型_Google_InfoQ精选文章