在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含 2000 多种不同音色

  • 2023-11-13
    北京
  • 本文字数:791 字

    阅读完需:约 3 分钟

大小:408.95K时长:02:19
网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色

11 月 10 日,网易有道正式上线“易魔声”开源语音合成(TTS)引擎,所有用户可免费在开源社区 GitHub 进行下载使用,通过其提供的 web 界面及批量生成结果的脚本接口,轻松实现音色的情感合成与应用。

 

据悉,“易魔声”是一款有道自研 TTS 引擎,目前支持中英文双语,包含 2000 多种不同的音色,更有特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。只需简单通过在文本中加入情感的描述提示,就可以自由合成符合自己需求的带有情感的语音,比传统 TTS 更加自然逼真。

 

随着基于 GAN 等现代 AI 技术的语音能力越来越成熟,实现一个质量较高的 TTS 系统的门槛越来越低。但即使如此,中英双语的高质量、现代 TTS 模块还是不易找到,要在自己的应用与内容中加入高逼真度且高度可控的语音,特别是中英双语的语音,也依然比较麻烦。

 

网易有道 CEO 周枫表示,“目前该项目还处于初期阶段,现在将这个项目开源,也是希望能帮助到有需求的开发者与内容创作者,并不断扩大高质量 TTS 的应用范围,让产品及应用更好地落地。也期待大家试用后给我们提供更多反馈与建议。”

 

公开信息显示,网易有道从 2008 年开始布局 AI,多年来一直致力于基于 Transformer 模型进行创新和应用,并在神经网络翻译、计算机视觉、高性能计算、智能语音 AI 技术等方面都具备了核心技术,为应用的实际落地打下了坚实的技术基础。在 TTS 领域,网易有道推出了多款高效便捷的应用和产品。例如,推出教育领域首个明星语音功能,将王源、欧阳娜娜、马伯骞等明星的声音内置在网易有道词典中,陪伴用户共同学习英语;提供声音定制和声音复刻功能,仅需 5 分钟即可完成个性化声音定制;近期推出的 Hi Echo 虚拟人口语私教,借助有道「子曰」教育大模型、语音和虚拟人技术,帮助用户随时随地轻松练习英语口语。

 

此外,用户还可通过有道智云官网,体验已经对开发者通过 API 等形式开放的文本和图像翻译、文字和各类图片识别、作文批改等各类 AI 技术。

2023-11-13 11:336438

评论

发布
暂无评论
发现更多内容

iOS开发:Xcode自带的模拟器常用快捷键的使用

三掌柜

8月日更 8月

破解AI开课难题!2021 全国人工智能师资培训落地厦门大学

百度大脑

人工智能

高可用架构(下)

编号94530

数据库 架构设计 异地多活容灾 高可用架构

耗时24小时整理了网络安全学习路线,非常详细!

网络安全学海

黑客 网络安全 信息安全 渗透测试 漏洞挖掘

云原生时代到来了么?

escray

学习 极客时间 如何落地业务建模 8月日更

前端之算法(七)动态规划

Augus

算法 8月日更

三分钟快速了解 Cglib 动态代理

4ye

Java 后端 cglib 代理模式 8月日更

敏捷实践 | 分不清Kanban和看板的只剩你了……

LigaAI

Scrum Kanban 敏捷开发 看板

聊一聊这些年看过的动漫

箭上有毒

8月日更

从0开始的TypeScriptの十:泛型

空城机

typescript 大前端 8月日更

蔚来事故背后,“致命弯道”在辅助驾驶和自动驾驶之间

脑极体

架构1期模块五作业

五只羊

架构实战营

模块五作业

老实人Honey

架构训练营

分片上传Minio存储服务的问题集锦[推荐收藏]

liuzhen007

8月日更

简简单单实现 Python Web 的登录注册页面,还包含一半逻辑。

梦想橡皮擦

8月日更

敏捷开发

LeifChen

Scrum 敏捷开发 迭代 8月日更

如何实现分布式锁,聊聊你的想法?

卢卡多多

redis 分布式锁 8月日更

Go- 常量

HelloBug

常量 const Go 语言

Go- 变量

HelloBug

变量 Go 语言

【设计模式】状态模式

Andy阿辉

C# 编程 后端 设计模式 8月日更

基于AOP和HashMap原理学习,开发Mysql分库分表路由组件!

小傅哥

小傅哥 hashmap 分库分表 aop 数据散列

还在死磕 Ajax?那可就 out 了!

编程三昧

JavaScript 大前端 8月日更 Fetch

【架构设计模块五】:设计微博系统中”微博评论“的高性能高可用计算架构

Ryoma

在线文字图标logo文章封面图生成工具

入门小站

工具

网络攻防学习笔记 Day108

穿过生命散发芬芳

网络安全 8月日更

Ansible 管理 Windows 机器配置过程。

耳东@Erdong

windows ansible 8月日更

Obsidian一个不错的软件

IT蜗壳-Tango

8月日更

Linux之ab命令

入门小站

Linux

Magician has released a new version

Magician网络编程包

Java Web 网络编程 io nio

JavaScript单元测试的“抹茶”组合:Mocha和Chai

devpoint

JavaScript 单元测试 8月日更

Flink 和流式应用运维(十-上)

Databri_AI

flink API REST API

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色_AI&大模型_凌敏_InfoQ精选文章