写点什么

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含 2000 多种不同音色

  • 2023-11-13
    北京
  • 本文字数:791 字

    阅读完需:约 3 分钟

大小:408.95K时长:02:19
网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色

11 月 10 日,网易有道正式上线“易魔声”开源语音合成(TTS)引擎,所有用户可免费在开源社区 GitHub 进行下载使用,通过其提供的 web 界面及批量生成结果的脚本接口,轻松实现音色的情感合成与应用。

 

据悉,“易魔声”是一款有道自研 TTS 引擎,目前支持中英文双语,包含 2000 多种不同的音色,更有特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。只需简单通过在文本中加入情感的描述提示,就可以自由合成符合自己需求的带有情感的语音,比传统 TTS 更加自然逼真。

 

随着基于 GAN 等现代 AI 技术的语音能力越来越成熟,实现一个质量较高的 TTS 系统的门槛越来越低。但即使如此,中英双语的高质量、现代 TTS 模块还是不易找到,要在自己的应用与内容中加入高逼真度且高度可控的语音,特别是中英双语的语音,也依然比较麻烦。

 

网易有道 CEO 周枫表示,“目前该项目还处于初期阶段,现在将这个项目开源,也是希望能帮助到有需求的开发者与内容创作者,并不断扩大高质量 TTS 的应用范围,让产品及应用更好地落地。也期待大家试用后给我们提供更多反馈与建议。”

 

公开信息显示,网易有道从 2008 年开始布局 AI,多年来一直致力于基于 Transformer 模型进行创新和应用,并在神经网络翻译、计算机视觉、高性能计算、智能语音 AI 技术等方面都具备了核心技术,为应用的实际落地打下了坚实的技术基础。在 TTS 领域,网易有道推出了多款高效便捷的应用和产品。例如,推出教育领域首个明星语音功能,将王源、欧阳娜娜、马伯骞等明星的声音内置在网易有道词典中,陪伴用户共同学习英语;提供声音定制和声音复刻功能,仅需 5 分钟即可完成个性化声音定制;近期推出的 Hi Echo 虚拟人口语私教,借助有道「子曰」教育大模型、语音和虚拟人技术,帮助用户随时随地轻松练习英语口语。

 

此外,用户还可通过有道智云官网,体验已经对开发者通过 API 等形式开放的文本和图像翻译、文字和各类图片识别、作文批改等各类 AI 技术。

2023-11-13 11:335653

评论

发布
暂无评论
发现更多内容

「架构实战营」模块一作业

between

架构实战营

【Java 试题】AQS解析

程序员架构进阶

AQS Java源码 28天写作 4月日更

“区块链+版权”应用保护者

电微13828808271

2021互联网大厂面经最新分享:百度/阿里/蚂蚁(附答案解析)

比伯

Java 架构 面试 程序人生 技术宅

有了这个框架,平台开发谁还手敲代码?

华为云开发者联盟

华为云 智慧园区 MainPortal 统一门户 HDC2021

如何用 iMazing 备份和恢复辐射避难所

懒得勤快

手机 游戏 ios管理 imazing

架构实战营模块 1 作业

Geek_2b52aa

架构实战营

架构实战营-模块1-微信业务架构-学生系统架构备选方案

吴建中

《iOS应用逆向与安全》

Thrash

读后感

手起刀落,连斩获阿里(四面)+字节(四面)+美团(三面)三家一线大厂Offer!

Java架构追梦

Java 架构 面试

“区块链+”,应用积分营销

电微13828808271

区块链

2021 年推荐给 React 开发者的 Visual Studio Code 插件及配置

清秋

推荐 vscode 插件 React 4月日更

牛比特小矿工系统开发|牛比特小矿工软件APP开发

系统开发

超低功耗LoRa无线通信应用实践

不脱发的程序猿

物联网 无线通信 4月日更 LoRa 无线通信模组

CSS实现动画环绕下划线效果

Sakura

4月日更

3d导航栏

赫鲁小夫

4月日更

你在备战“字节”时一定需要这个,程序员进大厂指南+算法已开源

Java架构师迁哥

什么是 NIO ?6000 字详解 NIO

hepingfly

Java nio IO流

Rust从0到1-结构体-定义和实例化

rust struct 结构体

拍乐云 x 扬帆出海 x LiveCloud:音视频出海专家干货分享

拍乐云Pano

flutter ios android WebRTC RTC

Spring Boot + RabbitMQ实现订单过期自动取消功能

Lonely Sufferer

RabbitMQ springboot

情指勤一体化指挥调度平台建设,重点人员管理平台

企业为何开始选择使用成品训练数据集?

澳鹏Appen

人工智能 机器学习 大数据 数据集 数据流

假期后来一波干货:一文理清JVM和GC

比伯

Java 程序员 架构 JVM 计算机

模块一:课后作业

sN0wpeak

架构实战营

架构实战营第一次作业

CmHuang

架构实战营

独家对话阿里云函数计算负责人不瞋:你所不知道的 Serverless

Serverless Devs

阿里云 运维 云原生 #Serverless

教你一个著名的流行数据格式:Python JSON

华为云开发者联盟

Python 数据 Python JSON JSON序列化 半结构化数据

架构训练营

架构训练营

架构实战营模块1作业

竹林七贤

翻译:《实用的Python编程》07_05_Decorated_methods

codists

Python

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色_AI&大模型_凌敏_InfoQ精选文章