写点什么

微软 Azure Neural TTS 新增对 9 个“小语种”语言及口音支持 | InfoQ 快讯

  • 2022-08-08
    北京
  • 本文字数:1395 字

    阅读完需:约 5 分钟

微软Azure Neural TTS 新增对9个“小语种”语言及口音支持 | InfoQ快讯

AI 语音技术的发展和应用,让中国用户在外语学习和对外沟通交流中获得了诸多便利。但对于国内的小语种学习者,或是正在小语种国家或地区开展业务的机构,目前还需要支持更多小语种的语音工具。


然而,由于缺乏训练数据,那些较少使用的口语,几乎没有任何可用的 TTS 工具。现在,在低资源TTS技术的支持下,微软 Azure 认知服务正在持续扩展对不同国家及地区语言的支持,满足更多用户的场景需求,例如小语种教育教学的有声读物、电子辞典等学习工具;面向相应国家和地区市场的 AI 语音助手、AI 语音客服;或是将 TTS 作为视频、音频等素材的生产工具,产出面向以上语种使用者的媒体产品等。


InfoQ 获悉,近期,微软 Azure Neural TTS 新增了对 9 个“小语种”语言及其不同口音的支持,包括:阿拉伯语(黎巴嫩)、阿拉伯语(阿曼)、阿塞拜疆语(阿塞拜疆)、波斯尼亚语(波黑)、格鲁吉亚语(格鲁吉亚)、蒙古语(蒙古)、尼泊尔语(尼泊尔)、阿尔巴尼亚语(阿尔巴尼亚)、泰米尔语(马来西亚)。以上几种语言均已公开发布,供开发者使用。


点击以下声音示例,感受这些不同风格的“小语种”语言。



示例:az-AZ BabekNeural 阿塞拜疆语(阿塞拜疆)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/az-AZ-BabekNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ar-LB RamiNeural 阿拉伯语(黎巴嫩)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ar-LB-RamiNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ne-NP SagarNeural 尼泊尔语(尼泊尔)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ne-NP-SagarNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:bs-BA VesnaNeural 波斯尼亚语(波黑)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/bs-BA-VesnaNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ta-MY KaniNaural 泰米尔语(马来西亚)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ta-MY-KaniNaural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


全球人类正在使用的语言有数千种,其中使用最多的前 1%(约 70 种语言)覆盖了全球 80%以上的人口,并且基本都得到了 TTS 技术的支持。但那些小语种的使用者,也应当享受 TTS 技术带来的便利。


图:微软 Azure Neural TTS 支持语言和声音列表


据悉,截止目前,Azure 认知服务的文本转语音模块支持全球140个国家和地区的语言,提供400个声音模型,企业能够利用Azure神经网络版声音定制服务,以多种语言和风格打造独特的品牌声音。微软 Azure AI 还提供语音转文本OCR翻译等一系列与语言相关的认知服务,所支持的语言已达 100 多种。

2022-08-08 18:334571
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 571.4 次阅读, 收获喜欢 1979 次。

关注

评论

发布
暂无评论
发现更多内容

一篇文章彻底理解 HDFS 的安全模式

明哥的IT随笔

hadoop hdfs

微服务连接:Subset子集划分算法

董哥的黑板报

微服务 云原生 连接 RPC 集群

两阶段提交与三阶段提交

急需上岸的小谢

11月月更

python中封装和继承

乔乔

11月月更

[力扣] 剑指 Offer 第四天 - 在排序数组中查找数字

陈明勇

Go 数据结构与算法 力扣 11月月更

kubernetes部署metrics-server

程序员欣宸

Kubernetes k8s 11月月更

uni-app实战之单击菜单发布->H5的Promise 化在工程项目的实战演练项目心得

恒山其若陋兮

前端 11月月更

精选2022年大厂高频Java面试真题集锦(含答案),面试一路开挂

程序知音

java面试 大厂面试 java架构 后端技术 Java面试八股文

网站与应用

我叫于豆豆吖.

11月月更

有限状态机

芯动大师

Verilog 11月月更 Melay FSM

网页基本代码

我叫于豆豆吖.

11月月更

纯原生渲染模式下的uni-App框架通信实战

恒山其若陋兮

前端 11月月更

Ubuntu16(ROS_Kinetic)海康威视网络摄像机(单目)内参标定

Studying_swz

ubuntu 11月月更

EasyExcel导出数据超过Excel单表上限解决方案

@下一站

大数据 技术 Excel Java core 11月月更

数据预处理和特征工程-特征选择-相关性过滤-互信息法 & F检验

烧灯续昼2002

人工智能 机器学习 算法 特征工程 11月月更

使用keytool生成Tomcat证书

源字节1号

软件开发 前端开发 后端开发 小程序开发

基于 jenkins 视图对 jenkins job 进行分类

忙着长大#

jenkins

Scrum Patterns:产品的自豪感(Product Pride)

Bruce Talk

Scrum 敏捷 Agile Scrum Patterns

架构误区系列5:滥用分布式锁

agnostic

分布式锁

代码的衡量标准

Lemoon Can

写好代码 好代码的衡量标准

极客时间运维进阶训练营第四周作业

忙着长大#

极客时间

OSPF路由协议三

初学者

网络 11月月更

OSPF高级配置——虚链路介绍与配置

我叫于豆豆吖.

11月月更

WX微信小程序对于响应的数据绑定和模块化生命周期的实战心得

恒山其若陋兮

前端开发 11月月更

云原生系列 二【轻松入门容器基础操作】

叶秋学长

云原生 华为云 沙箱实验 11月月更

cap理论和base理论

急需上岸的小谢

11月月更

TCC

急需上岸的小谢

11月月更

FL Studio水果软件V21完整版本全面升级支持简体中文语言界面

茶色酒

FL Studio 水果FL Studio FL Studio 21

2022-11-19:第二高的薪水。表结构和数据的sql语句如下,输出200,因为200是第二大的。请问sql语句如何写? DROP TABLE IF EXISTS `employee`; CREAT

福大大架构师每日一题

MySQL 数据库 福大大

【愚公系列】2022年11月 微信小程序-sitemap站内搜索

愚公搬代码

11月月更

GoFrame V2真香,我是Get到了高内聚低耦合的点,你呢?

王中阳Go

Go golang 高效工作 学习方法 11月月更

微软Azure Neural TTS 新增对9个“小语种”语言及口音支持 | InfoQ快讯_AI&大模型_刘燕_InfoQ精选文章