写点什么

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含 2000 多种不同音色

  • 2023-11-13
    北京
  • 本文字数:791 字

    阅读完需:约 3 分钟

大小:408.95K时长:02:19
网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色

11 月 10 日,网易有道正式上线“易魔声”开源语音合成(TTS)引擎,所有用户可免费在开源社区 GitHub 进行下载使用,通过其提供的 web 界面及批量生成结果的脚本接口,轻松实现音色的情感合成与应用。

 

据悉,“易魔声”是一款有道自研 TTS 引擎,目前支持中英文双语,包含 2000 多种不同的音色,更有特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。只需简单通过在文本中加入情感的描述提示,就可以自由合成符合自己需求的带有情感的语音,比传统 TTS 更加自然逼真。

 

随着基于 GAN 等现代 AI 技术的语音能力越来越成熟,实现一个质量较高的 TTS 系统的门槛越来越低。但即使如此,中英双语的高质量、现代 TTS 模块还是不易找到,要在自己的应用与内容中加入高逼真度且高度可控的语音,特别是中英双语的语音,也依然比较麻烦。

 

网易有道 CEO 周枫表示,“目前该项目还处于初期阶段,现在将这个项目开源,也是希望能帮助到有需求的开发者与内容创作者,并不断扩大高质量 TTS 的应用范围,让产品及应用更好地落地。也期待大家试用后给我们提供更多反馈与建议。”

 

公开信息显示,网易有道从 2008 年开始布局 AI,多年来一直致力于基于 Transformer 模型进行创新和应用,并在神经网络翻译、计算机视觉、高性能计算、智能语音 AI 技术等方面都具备了核心技术,为应用的实际落地打下了坚实的技术基础。在 TTS 领域,网易有道推出了多款高效便捷的应用和产品。例如,推出教育领域首个明星语音功能,将王源、欧阳娜娜、马伯骞等明星的声音内置在网易有道词典中,陪伴用户共同学习英语;提供声音定制和声音复刻功能,仅需 5 分钟即可完成个性化声音定制;近期推出的 Hi Echo 虚拟人口语私教,借助有道「子曰」教育大模型、语音和虚拟人技术,帮助用户随时随地轻松练习英语口语。

 

此外,用户还可通过有道智云官网,体验已经对开发者通过 API 等形式开放的文本和图像翻译、文字和各类图片识别、作文批改等各类 AI 技术。

2023-11-13 11:336288

评论

发布
暂无评论
发现更多内容

从设计到伴飞:数字孪生赋能航空航天新时代

DevOps和数字孪生

全球人形机器人赛道:2024年终汇总和2025年行业前瞻

机器人头条

科技 特斯拉 大模型 人形机器人 具身智能

Memcached 可观测性最佳实践

观测云

memcached

8折大优惠!联想企业购助力中小企业轻松迈入智能办公新时代

科技范儿

解锁AI潜力:AI在销售领域的应用案例(非Chatbot)

Baihai IDP

程序员 AI chatbot Baihai IDP

阿里大牛10年苦心终成Java面试突击指南,程序员突击找工作拿高薪offer必备!

程序员高级码农

Java 编程 程序员 java面试 Java面试题

《计算机组成及汇编语言原理》阅读笔记:p133-p159

codists

编程人 计算机组成及汇编语言原理

一场化工AI大赛,点亮行业智能化的星星之火

脑极体

AI

混合云网络过于复杂?ENS给你全局一张网的极致体验

不在线第一只蜗牛

网络

“赛博土木工程师”的多面人生:以技术绘制蓝图,分享知识行走江湖

华为云开发者联盟

物联网 IoT 人脸识别 OBS 华为云IoTDA

如何利用 ClickHouse 实现高级分析:MySQL 到 ClickHouse 实时数据同步指南

tapdata

数据迁移 实时数据复制 Metabase MySQL到ClickHouse 高级分析

探索 Pencils Swap 的叙事:打造流动性与链上收益枢纽

石头财经

25年国内最牛的Java面试八股文合集,不接受反驳

程序员高级码农

Java 编程 程序员 java面试 Java面试题

一图读懂|《企业级研发管理系统迁移指南》精华速览

万事ONES

项目管理 ONES 企业研发管理

ThinkPad X1 Carbon Aura:打破性能与便携悖论,打开AI PC行业新想象

科技范儿

探索 Pencils Swap 的叙事:为 DeFi 的再次爆发蓄力

BlockChain先知

新课上线丨如何借助华为项目管理经验,达到项目“事成人爽”的目标?

轶天下事

这几个 IoTDB 分布式调优的关键细节,你一定要知道!

Apache IoTDB

【HarmonyOS NEXT】ArkTS 线程模型解析与使用

冉冉同学

鸿蒙 HarmonyOS OpenHarmony HarmonyOS NEXT

从社区共识到资本效能:解析SYNBO的去中心化投资协议创新

股市老人

华为ensp-BGP联盟

阿落ovo

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色_AI&大模型_凌敏_InfoQ精选文章