写点什么

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含 2000 多种不同音色

  • 2023-11-13
    北京
  • 本文字数:791 字

    阅读完需:约 3 分钟

大小:408.95K时长:02:19
网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色

11 月 10 日,网易有道正式上线“易魔声”开源语音合成(TTS)引擎,所有用户可免费在开源社区 GitHub 进行下载使用,通过其提供的 web 界面及批量生成结果的脚本接口,轻松实现音色的情感合成与应用。

 

据悉,“易魔声”是一款有道自研 TTS 引擎,目前支持中英文双语,包含 2000 多种不同的音色,更有特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。只需简单通过在文本中加入情感的描述提示,就可以自由合成符合自己需求的带有情感的语音,比传统 TTS 更加自然逼真。

 

随着基于 GAN 等现代 AI 技术的语音能力越来越成熟,实现一个质量较高的 TTS 系统的门槛越来越低。但即使如此,中英双语的高质量、现代 TTS 模块还是不易找到,要在自己的应用与内容中加入高逼真度且高度可控的语音,特别是中英双语的语音,也依然比较麻烦。

 

网易有道 CEO 周枫表示,“目前该项目还处于初期阶段,现在将这个项目开源,也是希望能帮助到有需求的开发者与内容创作者,并不断扩大高质量 TTS 的应用范围,让产品及应用更好地落地。也期待大家试用后给我们提供更多反馈与建议。”

 

公开信息显示,网易有道从 2008 年开始布局 AI,多年来一直致力于基于 Transformer 模型进行创新和应用,并在神经网络翻译、计算机视觉、高性能计算、智能语音 AI 技术等方面都具备了核心技术,为应用的实际落地打下了坚实的技术基础。在 TTS 领域,网易有道推出了多款高效便捷的应用和产品。例如,推出教育领域首个明星语音功能,将王源、欧阳娜娜、马伯骞等明星的声音内置在网易有道词典中,陪伴用户共同学习英语;提供声音定制和声音复刻功能,仅需 5 分钟即可完成个性化声音定制;近期推出的 Hi Echo 虚拟人口语私教,借助有道「子曰」教育大模型、语音和虚拟人技术,帮助用户随时随地轻松练习英语口语。

 

此外,用户还可通过有道智云官网,体验已经对开发者通过 API 等形式开放的文本和图像翻译、文字和各类图片识别、作文批改等各类 AI 技术。

2023-11-13 11:336315

评论

发布
暂无评论
发现更多内容

存储成本降低80%,“大智慧”的选择

华为云开发者联盟

数据分析 存储 GaussDB(for Redis) 降本增效

Docker技术三大要点:cgroup, namespace 和 unionFS, 从理论到实践

汪子熙

Docker 容器 虚拟化 容器镜像 4月月更

专有云如何精准、及时地实现故障定位?丨智能运维

百度大脑

ModStart 是基于 Laravel 的模块化开发框架

ModStart开源

[Day16]-[链表]反转链表

方勇(gopher)

LeetCode 数据结构和算法

JVM虚拟机,基础原理总结

Java JVM 虚拟机

三问三答,解传统企业敏捷转型担忧

华为云开发者联盟

DevSecOps 华为云 敏捷转型 Scrum团队 敏捷团队

百度文心大模型「技术天团」首次亮相!首场技术开放日、AI创意派决赛来啦~

百度大脑

梳理数仓FI manager节点健康检查逻辑

华为云开发者联盟

运维 GaussDB(DWS) Manager 健康检查 FI manager

ERNIE-GeoL:“地理位置-语言”预训练模型

百度大脑

检测、跟踪、行为识别All-In-One!产业级行人分析系统重磅开源!

百度大脑

聚焦信息抽取前沿难题,CCKS-千言通用信息抽取竞赛报名启动

百度大脑

读《Software Engineering at Google》(06)

术子米德

架构师成长笔记

数据结构之链表中的快慢指针

乌龟哥哥

4月月更

外包学生管理系统详细架构设计

Geek_bc9c8d

5分钟搞懂MySQL - 索引下推优化

爱好编程进阶

Java 面试 后端开发

深入解析 Apache BookKeeper 系列:第二篇 — 写操作原理

Apache Pulsar

开源 架构 云原生 中间件 Apache Pulsar

数据分析之前知道这 7 件事,少花 80% 时间

龙国富

数据分析 数据采集

大咖云集,星环科技春季新品发布周【数字化转型专题】精彩抢先看

星环科技

数据库

7步搞懂分布式全内容,我不信面试官还敢“怼

爱好编程进阶

Java 面试 后端开发

高精度PP-YOLOE、轻量化PP-PicoDet SOTA模型重磅开源

百度大脑

一次简单易懂的多态重构实践,让你理解条件逻辑

华为云开发者联盟

多态 条件逻辑 多态重构 基础逻辑

Linux驱动开发-编写超声波测距模块的驱动

DS小龙哥

4月月更

PPDE迎新 | 欢迎18位AI开发者加入飞桨开发者技术专家计划

百度大脑

2021最新版SpringBoot实战项目教程,美团专家带你深入SpringBoot

爱好编程进阶

Java 面试 后端开发

内网渗透(蚁剑+MSF)

喀拉峻

网络安全 WEB安全 内网渗透

mac浏览器密码获取难?教你两种方法,轻松搞定

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

大转盘抽奖

Rubble

4月日更 4月月更

利用String.intern 减少相同值的String内存占用

lich0079

内存 intern java MAT String类

自己动手写Docker系列 -- 6.2创建网络

Go Docker 4月月更

前端食堂技术周刊第 33 期:IE 退休倒计时:3 个月、TypeScript 4.7 Beta、TypeScript 编译器工作原理、Rust 编码规范

童欧巴

前端 Web 前端工程师

网易有道上线“易魔声” 开源语音合成引擎,支持中英文双语,包含2000多种不同音色_AI&大模型_凌敏_InfoQ精选文章