2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

AI 创投公司 ElevenLabs 推新模型,可文字生成各式语音

  • 2024-02-21
    北京
  • 本文字数:1127 字

    阅读完需:约 4 分钟

大小:595.73K时长:03:23
AI 创投公司 ElevenLabs 推新模型,可文字生成各式语音

ElevenLabs,一家 AI 语音克隆初创公司,最近推出了一项创新技术,旨在为视频内容添加逼真的声音效果。这项技术特别针对那些缺乏声音背景的视频,类似于早期的默片。想象一下,就像 1895 年路易斯·卢米埃尔导演的《火车进站》一样,原本静默无声的场景,现在可以通过 AI 技术增添生动的声音,从而为观众带来更加丰富的观影体验。


ElevenLabs 利用文本到音效的模型,通过简单的文字提示,比如“海浪撞击”、“金属铿锵声”或“鸟鸣声”,就能生成相应的声音,并将其叠加到视频上。他们最近发布的一分钟预告片展示了这一技术的能力,不仅包括城市背景下的脚步声、海浪声、火车的咔哒声,甚至还有未来机器人的机械声和好莱坞风格的宣传片人声,所有这些都是通过文本提示生成的。


ElevenLabs 的这项新技术,虽然还未正式发布,但已经预示着它将为内容创作者提供一个全新的工具,使他们能够为原本无声的视频片段添加丰富的声效,包括脚步声、波浪声和氛围声等。这不仅为 AI 生成的内容开辟了新的领域,也为任何需要背景音效的视频,如 Instagram 视频、商业广告或视频游戏预告片等提供了无限可能。


不过,要生成准确的模拟效果并不是件容易的事,需要系统同时对文本和视频像素进行学习,以精确映射视频和音频之间的关系。这项技术的发展受到了包括英伟达 AI 科学家 Jim Fan 在内的业界专家的关注,他们认为,要完美模拟声效,需要考虑许多因素,这还是非常有挑战的。


活动推荐:

AICon 全球人工智能与大模型开发与应用大会暨通用人工智能开发与应用生态展·2024 即将于 5 月 17-18 日举行。这是一场主要面向工程师、产品经理、数据分析师的大模型会议,会议聚焦大模型训练与推理、AI agent、RAG、多模态大模型等热门方向,会议不仅安排了精彩的演讲,还策划了包括闭门会议、圆桌交流、大模型应用互动展演等多种社交活动,一方面为参会人员提供宝贵的交流学习、拓展人脉的机会,另一方面也为相关企业和机构提供一个展示自身实力和成果的舞台。


目前已确认出席嘉宾:

林咏华,北京智源人工智能研究院,副院长兼总工程师

谢剑,百川智能,技术联合创始人

余锋(褚霸),蚂蚁集团,蚂蚁超级计算部负责人,专题出品人

张佶,阿里巴巴,通义实验室 NLP 资深算法专家

杨萍,字节跳动,Code AI 团队技术负责人

李鑫 博士,科大讯飞,AI 研究院副院长、科研部部长

郭瑞杰,阿里巴巴,总监

陈祖龙,阿里巴巴,企业智能算法负责人

杨浩 博士,华为,文本机器翻译实验室主任

张科,蚂蚁集团,AI Infra 负责人

孟二利,小米,AI 实验室机器学习团队技术主管,专题演讲嘉宾

崔慧敏,中科加禾,创始人 & CEO

汪晟杰,腾讯,资深产品经理

陈鸿,蚂蚁集团,资深算法专家

陶万杰,马上消费金融,算法总监

季超,科大讯飞,人形机器人总负责人


更多精彩议题上线中... 详细内容可点击这里查看。

2024-02-21 14:175736

评论

发布
暂无评论
发现更多内容

虾皮(shopee)商品详情接口(虾皮API系列)

tbapi

虾皮商品详情接口 shopee API 虾皮API 虾皮商品数据采集

音乐NFT的钱包对接流程

北京木奇移动技术有限公司

区块链技术 软件外包公司 音乐NFT

【DeepSeek版】JeecgBoot低代码 3.7.3 发布,集成DeepSeek实现AI编程

JEECG低代码

低代码平台 代码生成 JeecgBoot DeepSeek

智能名片系统(源码+文档+部署+讲解)

深圳亥时科技

数造科技入选全国数标委首批成员单位,引领数据标准化新方向!

数造万象

行业资讯 数据治理 科技 数据标准 数据流通

加速无索引表引起的主从延迟数据回放

GreatSQL

活动回顾|Apache Cloudberry™ Meetup · 上海站暨中文用户组年终聚会

酷克数据HashData

选购成品陪玩系统软件时,要考虑哪些因素?陪玩系统软件开发定制陪玩小程序源码,满足您的个性化需求

DUOKE七七

MySQL uniapp thinkphp

从图像到信息,AI识图开启智能识别新时代

HarmonyOS SDK

harmoyos

速度超越DeepSeek!Le Chat 1100tok/s闪电回答,ChatGPT 4o和DeepSeek R1被秒杀?

智领云科技

浏览量超 10w 的热图,描述 RAG 的主流架构

阿里巴巴云原生

阿里云 云原生

如何管理能力比自己强的下属

易成研发中心

团队管理

人工智能丨如何通过DeepSeek优化软件测试工作,提升效率与准确度

测试人

如何制定好绩效管理体系

易成研发中心

网易元宵节能提前下班,你慕了吗?

王中阳Go

Go 网易

DGL(0.8.x) 技术点分析

Splendid2025

人工智能

人工智能丨DeepSeek、文心一言、Kimi、豆包、可灵……谁才是你的最佳AI助手?

测试人

软件测试

DeepSeek 快速体验,魔搭+函数计算一键部署模型上云

阿里巴巴云原生

阿里云 云原生

淘宝店铺商品数据一网打尽:详解Taobao.item_search_shop接口

代码忍者

淘宝API接口

【实战经验分享】1688API商品详情和关键词搜索商品的正确打开方式 中小商家必看!

代码忍者

1688API接口

告警事件如何与 CMDB 打通附加更多元信息

巴辉特

告警管理 告警信息丰富 告警OnCall 告警响应

人工智能是否会发展出“自我意识”?科学与科幻的交汇

天津汇柏科技有限公司

人工智能

一键解锁 AI 动画视频创作,赢好礼

阿里巴巴云原生

阿里云 云原生

从大规模恶意攻击 DeepSeek 事件看 AI 创新隐忧:安全可观测体系建设刻不容缓

阿里巴巴云原生

阿里云 云原生

智能灌溉管理系统(源码+文档+部署+讲解)

深圳亥时科技

NineData云原生智能数据管理平台新功能发布|2025年1月版

NineData

数据库 工具 数据管理 NineData

深度解读「摩根士丹利」人形机器人最新研报:100家人形机器人价值链(附报告)

机器人头条

科技 大模型 人形机器人 具身智能

AI 创投公司 ElevenLabs 推新模型,可文字生成各式语音_AI&大模型_李忠良_InfoQ精选文章