写点什么

AI 创投公司 ElevenLabs 推新模型,可文字生成各式语音

  • 2024-02-21
    北京
  • 本文字数:1127 字

    阅读完需:约 4 分钟

大小:595.73K时长:03:23
AI 创投公司 ElevenLabs 推新模型,可文字生成各式语音

ElevenLabs,一家 AI 语音克隆初创公司,最近推出了一项创新技术,旨在为视频内容添加逼真的声音效果。这项技术特别针对那些缺乏声音背景的视频,类似于早期的默片。想象一下,就像 1895 年路易斯·卢米埃尔导演的《火车进站》一样,原本静默无声的场景,现在可以通过 AI 技术增添生动的声音,从而为观众带来更加丰富的观影体验。


ElevenLabs 利用文本到音效的模型,通过简单的文字提示,比如“海浪撞击”、“金属铿锵声”或“鸟鸣声”,就能生成相应的声音,并将其叠加到视频上。他们最近发布的一分钟预告片展示了这一技术的能力,不仅包括城市背景下的脚步声、海浪声、火车的咔哒声,甚至还有未来机器人的机械声和好莱坞风格的宣传片人声,所有这些都是通过文本提示生成的。


ElevenLabs 的这项新技术,虽然还未正式发布,但已经预示着它将为内容创作者提供一个全新的工具,使他们能够为原本无声的视频片段添加丰富的声效,包括脚步声、波浪声和氛围声等。这不仅为 AI 生成的内容开辟了新的领域,也为任何需要背景音效的视频,如 Instagram 视频、商业广告或视频游戏预告片等提供了无限可能。


不过,要生成准确的模拟效果并不是件容易的事,需要系统同时对文本和视频像素进行学习,以精确映射视频和音频之间的关系。这项技术的发展受到了包括英伟达 AI 科学家 Jim Fan 在内的业界专家的关注,他们认为,要完美模拟声效,需要考虑许多因素,这还是非常有挑战的。


活动推荐:

AICon 全球人工智能与大模型开发与应用大会暨通用人工智能开发与应用生态展·2024 即将于 5 月 17-18 日举行。这是一场主要面向工程师、产品经理、数据分析师的大模型会议,会议聚焦大模型训练与推理、AI agent、RAG、多模态大模型等热门方向,会议不仅安排了精彩的演讲,还策划了包括闭门会议、圆桌交流、大模型应用互动展演等多种社交活动,一方面为参会人员提供宝贵的交流学习、拓展人脉的机会,另一方面也为相关企业和机构提供一个展示自身实力和成果的舞台。


目前已确认出席嘉宾:

林咏华,北京智源人工智能研究院,副院长兼总工程师

谢剑,百川智能,技术联合创始人

余锋(褚霸),蚂蚁集团,蚂蚁超级计算部负责人,专题出品人

张佶,阿里巴巴,通义实验室 NLP 资深算法专家

杨萍,字节跳动,Code AI 团队技术负责人

李鑫 博士,科大讯飞,AI 研究院副院长、科研部部长

郭瑞杰,阿里巴巴,总监

陈祖龙,阿里巴巴,企业智能算法负责人

杨浩 博士,华为,文本机器翻译实验室主任

张科,蚂蚁集团,AI Infra 负责人

孟二利,小米,AI 实验室机器学习团队技术主管,专题演讲嘉宾

崔慧敏,中科加禾,创始人 & CEO

汪晟杰,腾讯,资深产品经理

陈鸿,蚂蚁集团,资深算法专家

陶万杰,马上消费金融,算法总监

季超,科大讯飞,人形机器人总负责人


更多精彩议题上线中... 详细内容可点击这里查看。

2024-02-21 14:175295

评论

发布
暂无评论
发现更多内容

【YashanDB知识库】outline固化执行计划

YashanDB

yashandb 崖山数据库

一台桌面工作站的智慧之光,照见宁畅“全局智算”版图

脑极体

AI

SD-WAN实现企业出海网络加速

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

低代码开发赋能教育数字化及典型场景

不在线第一只蜗牛

低代码 教育新创

SMC-R 透明加速 TCP 技术,在 Redis 场景下的应用实践 | 干货推荐

OpenAnolis小助手

操作系统 龙蜥社区 SMC-R 浪潮信息 TCP 技术

ApsaraMQ Copilot for RocketMQ:消息数据集成链路的健康管家

阿里巴巴云原生

阿里云 RocketMQ 云原生

被黑客入侵的 DMM 比特币为比特币购买获得 3.2 亿美元

web3区块链创业团队DappNetWork

计算机英文教材太难啃?Higress 和通义千问帮你!

阿里巴巴云原生

阿里云 云原生 Higress

广东人仁康一项技术通过国家科技成果评价达到国际先进水平平

极客天地

Netty FastThreadLocal实践

FunTester

Altair RapidMiner,将数据科学、深度学习等多种功能同时集成的一站式数据分析平台

Altair RapidMiner

机器学习 大模型 #人工智能 #数据分析

Mint Blockchain 成立 Mint Eco Fund 发展基金,并启动 Season1 开发者活动 NFT Summer!

NFT Research

NFT Layer 2

天谋科技与腾讯云完成兼容性互认证

Apache IoTDB

报名倒计时 2 天!龙蜥社区系统安全 Meetup 演讲亮点一览

OpenAnolis小助手

操作系统 系统安全 浪潮信息 龙蜥meetup

iLogtail 2.0 重大升级,端上支持 SPL

阿里巴巴云原生

阿里云 云原生 日志服务 sls

惊了!字节大佬总结的这份《零基础学python神级笔记全彩版》真的太强了

没脾气

Python 程序员 自学编程 架构师 自学python

龙蜥社区 5 月度运营大事件回顾

OpenAnolis小助手

开源 操作系统 龙蜥社区 月报

低代码用得好,开发真的很顺手

伤感汤姆布利柏

GitHub爆火标星127k!这份字节Python背记手册到底有什么魔力?

没脾气

Python 程序员 自学编程 python教程 python自学

从仿真到生成式仿真,大模型助力工业智能化发展

Altair RapidMiner

#人工智能 仿真技术 制造业数字化 #大模型

业务转型,你的团队该如何应对?

凌晞

团队管理 数字化业务转型IT路线图

天润融通,荣获2024中国AI应用层创新企业

天润融通

人工智能 天润融通

PingCAP 与沙利文联合发布《中国企业全球化运营白皮书》

先锋IT

小游戏应该如何创建一个元服务项目

FN0

鸿蒙卡片 元服务

案例研究|为什么 CDG 会选择从 DataDog 迁移至观测云?

观测云

可观测性

运营海外社媒平台的最佳工具:云手机

Ogcloud

云手机 海外云手机 云手机海外版 国外云手机 海外云手机推荐

6 大亮点!全新 Anolis OS 23.1 GA 版正式发布,满足多样化平台支持

OpenAnolis小助手

操作系统 国产操作系统 龙蜥操作系统 Anolis OS Anolis OS 23.1

AI 创投公司 ElevenLabs 推新模型,可文字生成各式语音_AI&大模型_李忠良_InfoQ精选文章