写点什么

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含 2000 多种不同音色

  • 2023-11-13
    北京
  • 本文字数:791 字

    阅读完需:约 3 分钟

大小:408.95K时长:02:19
网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色

11 月 10 日,网易有道正式上线“易魔声”开源语音合成(TTS)引擎,所有用户可免费在开源社区 GitHub 进行下载使用,通过其提供的 web 界面及批量生成结果的脚本接口,轻松实现音色的情感合成与应用。

 

据悉,“易魔声”是一款有道自研 TTS 引擎,目前支持中英文双语,包含 2000 多种不同的音色,更有特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。只需简单通过在文本中加入情感的描述提示,就可以自由合成符合自己需求的带有情感的语音,比传统 TTS 更加自然逼真。

 

随着基于 GAN 等现代 AI 技术的语音能力越来越成熟,实现一个质量较高的 TTS 系统的门槛越来越低。但即使如此,中英双语的高质量、现代 TTS 模块还是不易找到,要在自己的应用与内容中加入高逼真度且高度可控的语音,特别是中英双语的语音,也依然比较麻烦。

 

网易有道 CEO 周枫表示,“目前该项目还处于初期阶段,现在将这个项目开源,也是希望能帮助到有需求的开发者与内容创作者,并不断扩大高质量 TTS 的应用范围,让产品及应用更好地落地。也期待大家试用后给我们提供更多反馈与建议。”

 

公开信息显示,网易有道从 2008 年开始布局 AI,多年来一直致力于基于 Transformer 模型进行创新和应用,并在神经网络翻译、计算机视觉、高性能计算、智能语音 AI 技术等方面都具备了核心技术,为应用的实际落地打下了坚实的技术基础。在 TTS 领域,网易有道推出了多款高效便捷的应用和产品。例如,推出教育领域首个明星语音功能,将王源、欧阳娜娜、马伯骞等明星的声音内置在网易有道词典中,陪伴用户共同学习英语;提供声音定制和声音复刻功能,仅需 5 分钟即可完成个性化声音定制;近期推出的 Hi Echo 虚拟人口语私教,借助有道「子曰」教育大模型、语音和虚拟人技术,帮助用户随时随地轻松练习英语口语。

 

此外,用户还可通过有道智云官网,体验已经对开发者通过 API 等形式开放的文本和图像翻译、文字和各类图片识别、作文批改等各类 AI 技术。

2023-11-13 11:336344

评论

发布
暂无评论
发现更多内容

智源联合南开大学开源Chinese-LiPS中文多模态语音识别数据集

智源研究院

Mint Blockchain 主网上线一周年回顾:增长之年与未来展望

NFT Research

NFT web3、

CAD图纸如何进行坐标标注?

在路上

cad cad看图

AI赋能时尚零售供应链智能决策:四大核心价值重构竞争力

第七在线

C#多线程编程精要:从用户线程到线程池的效能进化论

不在线第一只蜗牛

C#

YashanDB|Oracle 里的 XMLAGG 迁不过来?换成 WM_CONCAT 就对了

数据库砖家

数据库

合合信息上线智能文档处理领域首批MCP服务,助力企业快速搭建Agent

合合技术团队

人工智能 算法 #大数据

macOS Sonoma 14.7.6 (23H626) Boot ISO 原版可引导镜像下载

sysin

macos

新疆五家等保测评机构名称以及地址汇总

行云管家

网络安全 等保 等保测评 等保测评机构

会议纪要自动生成软件!AI一键搞定会议纪要,办公必备!

职场工具箱

人工智能 AI 办公软件 AIGC 会议纪要

比特币交易接近 104000 美元,分析师称「再创新高并非不可能」

PowerVerse

比特币 加密货币 分析

YashanDB|复合索引用了也慢?IN 参数太多时建议这样调

数据库砖家

数据库

macOS Sequoia 15.5 (24F74) Boot ISO 原版可引导镜像下载

sysin

macos

Qwen3 系列全家桶,百度百舸一键部署

百度Geek说

鸿蒙HarmonyOS开发:零基础也能成为开发者

Lethehong

鸿蒙 HarmonyOS HarmonyOS NEXT DeepSeek v3 实践分享

CAD三维图纸如何测量?详细教程来了

在路上

cad cad看图 CAD看图王

理解 C# 中的各类指针

电子尖叫食人鱼

Java C#

YashanDB|Oracle 中的 pipelined 表函数迁移不过?这样改写就对了

数据库砖家

数据库

CST软件如何将单端转换为差模共模

思茂信息

cst CST软件 CST Studio Suite

工厂管理中的5个常见误区,90%的企业都踩过!

积木链小链

数字化转型 智能制造 工厂管理

YashanDB|服务器重启后数据库无法启动?别忘了这个关键服务

数据库砖家

数据库

YashanDB|IN 参数超 300 个,查询突然变慢?问题可能出在执行计划上

数据库砖家

数据库·

中国版Cursor:基于CodeBuddy与EdgeOne Pages的在线键盘测试工具开发方案

穿过生命散发芬芳

MCP CodeBuddy CodeBuddy首席试玩官

推荐几个常用免费的文本转语音工具

石臻臻的杂货铺

YashanDB|JDBC getString 取 DATE 字段不带时分秒?两个方法解决!

数据库砖家

数据库

YashanDB |报错 no free block in dictionary cache?共享集群中的卡顿真凶找到了

数据库砖家

数据库

国家信息安全等级保护三级认证定义以及流程简单讲解

行云管家

网络安全 数据安全 等保 等保测评

YashanDB |YMP 迁移时报错 account lock?别让低版本 OpenSSL 坑了你

数据库砖家

HyperWorks卫星惯性释放分析(OptiStruct)

智造软件

仿真 Hypermesh hyperworks

【华为云MySQL技术专栏】MySQL分区裁剪,提升分区表查询性能

华为云开发者联盟

:MySQL 数据库 ,华为云

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色_AI&大模型_凌敏_InfoQ精选文章