写点什么

谷歌推出 DolphinGemma:探索海豚语言的 AI 工具

作者:Robert Krzaczyński

  • 2025-05-18
    北京
  • 本文字数:969 字

    阅读完需:约 3 分钟

大小:472.02K时长:02:41
谷歌推出 DolphinGemma:探索海豚语言的 AI 工具

谷歌发布了一种名为 DolphinGemma 的新型人工智能模型,它可以帮助研究人员分析和解读海豚的声音。该项目是谷歌与野生海豚项目(Wild Dolphin Project,WDP)以及乔治亚理工学院研究人员持续合作的一部分,专注于识别大西洋斑点海豚自然交流中的模式。


DolphinGemma 基于谷歌的 Gemma 语言模型架构,并针对音频数据进行了专门调整。它使用 SoundStream 分词器将海豚的声音转换为机器可读的序列,使模型能够检测重复的模式并预测序列中可能出现的下一个声音。该模型大约 4 亿参数,足够小,可以在智能手机上本地运行,包括 WDP 在野外使用的谷歌 Pixel 设备。


WDP 已经编制了一份最全面的野生海豚行为和声音数据集,这些数据收集自近四十年的观察。该数据集包括与已知个体海豚、它们的社会关系以及观察到的行为相关联的音频和视频记录。研究者利用它发出一些类似海豚的声音,并将这些词汇与特地的物品联系起来(比如海藻、研究者的围巾)。


DolphinGemma 可以分析这些数据,帮助研究人员发现海豚自然交流中的隐藏结构和潜在含义。


除了分析自然交流外,DolphinGemma 还被整合到乔治亚理工学院开发的 CHAT(鲸类听觉增强遥测)系统中。CHAT 通过使用与海豚互动的物体(如海藻或研究者的围巾)相关联的合成哨声,实现了一种与海豚的基本符号互动。如果海豚模仿这些声音,研究人员可以将其解释为对物体的请求。


DolphinGemma 通过提高声音识别的准确性和响应速度来支持该系统,这两者在水下互动中至关重要。

该模型可以在最新的智能手机上运行,如谷歌 Pixel 9,减少了对定制硬件的需求。这简化了在野外条件下的部署,并有助于降低系统的成本和体积。手机的内置处理能力使 DolphinGemma 在实地考察中能够实时运行,协助研究人员追踪和响应海豚的叫声。


谷歌表示计划在 2025 年晚些时候将 DolphinGemma 作为开源模型发布。尽管该模型目前是基于大西洋斑点海豚的叫声进行训练的,但可以针对其他物种进行微调。这会支持更广泛的鲸类交流研究,实际应用将取决于每个物种是否有足够标注良好的数据集。


尽管该模型无法直接解读海豚交流的具体含义,但它可以帮助研究人员识别出一些结构特征,从而为后续研究提供方向。这一消息在人工智能研究界引起了广泛关注,许多人认为这可能是理解非人类交流的一个潜在转折点。


原文链接:

Google Introduces DolphinGemma to Support Dolphin Communication Research

2025-05-18 13:004290

评论

发布
暂无评论

如何编写优质Prompt的秘诀

百度开发者中心

#人工智能 ChatGPT 文心一言

自然语言处理的卓越未来

百度开发者中心

#人工智能 ChatGPT 文心一言 千帆大模型平台

TuGraph Analytics 流图计算之行为路径归因

TuGraphAnalytics

实时计算 图计算 归因分析 行为分析

凝创新技术,汇数字力量 欧特克数字赋能『智』造汽车高峰论坛在沪开幕

E科讯

百度智能云与蓝色光标共绘AI营销新篇章:袁佛玉亮相Blue AI行业模型发布会,千帆平台引领行业模型创新之路

极客天地

大模型驱动全面重构,百度联盟的增长飞轮转起来了

极客天地

百度肖阳:语义检索技术和大语言模型深度结合,重构百度搜索

极客天地

字节跳动基础架构编排调度团队论文入选云计算领域顶会 SoCC 2023

字节跳动云原生计算

大数据 云原生 编排调度

【案例教学】华为云API对话机器人的魅力—体验AI垃圾分类机器人

云计算 软件开发 华为云

马斯克回应盖茨;谷歌反垄断案开庭;苹果发布 3nm 芯片的 iPhone 15丨RTE开发者日报 Vol.48

RTE开发者社区

AITO问界M9工信部申报信息曝光,或将是理想L9的最大对手?

极客天地

无代码编程时代的到来:新兴工具和平台的前瞻展望

互联网工科生

低代码 数据可视化 JNPF

glTF和GLB有什么区别?

3D建模设计

GLTF glb

41 个下载免费 3D 模型的最佳网站

3D建模设计

模型 3D

矩视云平台SDK可以支持本地检测吗

矩视智能

机器视觉 深度学习、

分布式锁的三种实现方式!

树上有只程序猿

乐观锁 悲观锁 分布式锁

解锁 Postman 接口测试:完整指南

Liam

Java 程序员 Postman 接口测试 测试工具

你应该知道的几个国产化平台-行云管家

行云管家

信创 国产化 国产化平台

搭建无损网络的关键要素与技术

百度开发者中心

AIGC ChatGPT 千帆大模型平台

一次性全讲透GaussDB(DWS)锁的问题

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号9月PK榜

推动长期成功:NFT 推广机构如何制定可持续战略

区块链软件开发推广运营

数字藏品开发 dapp开发 区块链开发 链游开发 NFT开发

打败传统Scada系统的Web Scada是什么?

2D3D前端可视化开发

物联网 组态软件 工业控制 web scada scada系统

苹果再发“黑科技”,合合信息扫描全能王新功能支持“360度立体式建模”

合合技术团队

苹果 科技 合合信息 #人工智能 扫描全能王

科兴未来 | 2023年河北国际先进技术创新挑战赛

科兴未来News

谷歌推出 DolphinGemma:探索海豚语言的 AI 工具_自然语言处理_InfoQ精选文章