写点什么

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含 2000 多种不同音色

  • 2023-11-13
    北京
  • 本文字数:791 字

    阅读完需:约 3 分钟

大小:408.95K时长:02:19
网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色

11 月 10 日,网易有道正式上线“易魔声”开源语音合成(TTS)引擎,所有用户可免费在开源社区 GitHub 进行下载使用,通过其提供的 web 界面及批量生成结果的脚本接口,轻松实现音色的情感合成与应用。

 

据悉,“易魔声”是一款有道自研 TTS 引擎,目前支持中英文双语,包含 2000 多种不同的音色,更有特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。只需简单通过在文本中加入情感的描述提示,就可以自由合成符合自己需求的带有情感的语音,比传统 TTS 更加自然逼真。

 

随着基于 GAN 等现代 AI 技术的语音能力越来越成熟,实现一个质量较高的 TTS 系统的门槛越来越低。但即使如此,中英双语的高质量、现代 TTS 模块还是不易找到,要在自己的应用与内容中加入高逼真度且高度可控的语音,特别是中英双语的语音,也依然比较麻烦。

 

网易有道 CEO 周枫表示,“目前该项目还处于初期阶段,现在将这个项目开源,也是希望能帮助到有需求的开发者与内容创作者,并不断扩大高质量 TTS 的应用范围,让产品及应用更好地落地。也期待大家试用后给我们提供更多反馈与建议。”

 

公开信息显示,网易有道从 2008 年开始布局 AI,多年来一直致力于基于 Transformer 模型进行创新和应用,并在神经网络翻译、计算机视觉、高性能计算、智能语音 AI 技术等方面都具备了核心技术,为应用的实际落地打下了坚实的技术基础。在 TTS 领域,网易有道推出了多款高效便捷的应用和产品。例如,推出教育领域首个明星语音功能,将王源、欧阳娜娜、马伯骞等明星的声音内置在网易有道词典中,陪伴用户共同学习英语;提供声音定制和声音复刻功能,仅需 5 分钟即可完成个性化声音定制;近期推出的 Hi Echo 虚拟人口语私教,借助有道「子曰」教育大模型、语音和虚拟人技术,帮助用户随时随地轻松练习英语口语。

 

此外,用户还可通过有道智云官网,体验已经对开发者通过 API 等形式开放的文本和图像翻译、文字和各类图片识别、作文批改等各类 AI 技术。

2023-11-13 11:335374

评论

发布
暂无评论
发现更多内容

智能护航:人工智能引领软件测试新革命

测吧(北京)科技有限公司

测试

人工智能引领软件测试新的巨大变革

霍格沃兹测试开发学社

测试一波回归模型的误差

EquatorCoco

人工智能 数据 回归 挖掘

打破购物局限!了解闲鱼商品详情关键词搜索电商API接口,挖掘不一样的购物乐趣!

联讯数据

云计算 - 以阿里云为例,企业上云策略全览与最佳实践

快乐非自愿限量之名

云计算 云原生 项目开发

吴恩达AI系列第一课:教你如何利用AI创建一个披萨店客服

cloud studio AI应用

Cloud Cloud Studio 人工智能、

面试官:说一下红锁RedLock的实现原理?

王磊

Java 面试

为多渠道销售集成商品API接口的正式步骤指南

Noah

英特尔亮相MWC 2024,助力企业通过现代化以实现盈利

E科讯

独立站谷歌SEO外包与自建SEO团队:哪个更适合您的业务?

九凌网络

金三银四,聊一聊测试跳槽/面试的必备技能

霍格沃兹测试开发学社

SD-WAN技术简化企业网络架构的关键优势

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

优雅使用前端枚举Enum,符合国标的那种!

不在线第一只蜗牛

前端 开发 前端框架 Enum

SD-WAN在银行的应用:降低维护成本、提升网络安全

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

SATX合约代币矩阵公排系统开发详情

l8l259l3365

如何做代币分析:以 TRX 币为例

Footprint Analytics

加密货币 Token 代币

敏捷开发最佳实践:团队维度实践案例——打造敏捷“绿洲”

爱吃小舅的鱼

敏捷 敏捷开发

聚道云助力时尚巨头打通数据孤岛,实现全渠道管理升级!

聚道云软件连接器

案例分享

都说了别用BeanUtils.copyProperties,这不翻车了吧

不在线第一只蜗牛

Java 数据库 后端 Java后端

SD-WAN与MPLS哪一个是最优选择?

Ogcloud

SD-WAN MPLS SD-WAN组网 SD-WAN服务商 SDWAN

解锁财务信任,掌握企业业务合作中的倾听艺术

智达方通

业财融合 全面预算管理 财务管理 经营管理

为什么说第三代指标平台的本质是做 “轻” 数仓?

Aloudata

ETL 指标平台

文心一言 VS 讯飞星火 VS chatgpt (203)-- 算法导论15.3 2题

福大大架构师每日一题

福大大架构师每日一题

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色_AI&大模型_凌敏_InfoQ精选文章