AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

微软 Azure Neural TTS 新增对 9 个“小语种”语言及口音支持 | InfoQ 快讯

  • 2022-08-08
    北京
  • 本文字数:1395 字

    阅读完需:约 5 分钟

微软Azure Neural TTS 新增对9个“小语种”语言及口音支持 | InfoQ快讯

AI 语音技术的发展和应用,让中国用户在外语学习和对外沟通交流中获得了诸多便利。但对于国内的小语种学习者,或是正在小语种国家或地区开展业务的机构,目前还需要支持更多小语种的语音工具。


然而,由于缺乏训练数据,那些较少使用的口语,几乎没有任何可用的 TTS 工具。现在,在低资源TTS技术的支持下,微软 Azure 认知服务正在持续扩展对不同国家及地区语言的支持,满足更多用户的场景需求,例如小语种教育教学的有声读物、电子辞典等学习工具;面向相应国家和地区市场的 AI 语音助手、AI 语音客服;或是将 TTS 作为视频、音频等素材的生产工具,产出面向以上语种使用者的媒体产品等。


InfoQ 获悉,近期,微软 Azure Neural TTS 新增了对 9 个“小语种”语言及其不同口音的支持,包括:阿拉伯语(黎巴嫩)、阿拉伯语(阿曼)、阿塞拜疆语(阿塞拜疆)、波斯尼亚语(波黑)、格鲁吉亚语(格鲁吉亚)、蒙古语(蒙古)、尼泊尔语(尼泊尔)、阿尔巴尼亚语(阿尔巴尼亚)、泰米尔语(马来西亚)。以上几种语言均已公开发布,供开发者使用。


点击以下声音示例,感受这些不同风格的“小语种”语言。



示例:az-AZ BabekNeural 阿塞拜疆语(阿塞拜疆)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/az-AZ-BabekNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ar-LB RamiNeural 阿拉伯语(黎巴嫩)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ar-LB-RamiNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ne-NP SagarNeural 尼泊尔语(尼泊尔)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ne-NP-SagarNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:bs-BA VesnaNeural 波斯尼亚语(波黑)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/bs-BA-VesnaNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ta-MY KaniNaural 泰米尔语(马来西亚)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ta-MY-KaniNaural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


全球人类正在使用的语言有数千种,其中使用最多的前 1%(约 70 种语言)覆盖了全球 80%以上的人口,并且基本都得到了 TTS 技术的支持。但那些小语种的使用者,也应当享受 TTS 技术带来的便利。


图:微软 Azure Neural TTS 支持语言和声音列表


据悉,截止目前,Azure 认知服务的文本转语音模块支持全球140个国家和地区的语言,提供400个声音模型,企业能够利用Azure神经网络版声音定制服务,以多种语言和风格打造独特的品牌声音。微软 Azure AI 还提供语音转文本OCR翻译等一系列与语言相关的认知服务,所支持的语言已达 100 多种。

2022-08-08 18:334496
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 560.3 次阅读, 收获喜欢 1978 次。

关注

评论

发布
暂无评论
发现更多内容

LeetCode题解:89.格雷编码,归纳法,详细注释

Lee Chen

第一届中国研究生操作系统开源创新大赛总决赛在长沙圆满落幕

最新动态

Apache Flink 2.0-preview released

Apache Flink

大数据 Apache Flink Apache Paimon

「Mac畅玩鸿蒙与硬件1」鸿蒙开发环境配置1 - 认识鸿蒙系统与开发工具

SoraLuna

鸿蒙 硬件

「Mac畅玩鸿蒙与硬件2」鸿蒙开发环境配置2 - 在 Mac 上安装 DevEco Studio

SoraLuna

鸿蒙 硬件

LeetCode题解:2357. 使数组中所有元素都等于零,哈希表,详细注释

Lee Chen

LeetCode题解:1238. 循环码排列,归纳法,详细注释

Lee Chen

2363. 合并相似的物品,双指针,详细注释

Lee Chen

LeetCode题解:2373. 矩阵中的局部最大值,遍历,详细注释

Lee Chen

淘宝商品评论API返回值中的用户等级与信誉

技术冰糖葫芦

API 接口 API 文档 API 测试 API 策略

提升数据管理效率:ETLCloud与达梦数据库的数据集成

RestCloud

数据库 数据同步 ETL 数据集成 达梦数据库

全域重复数据资产的自动识别与治理策略

Aloudata

数据治理 数据资产 元数据 数据血缘

点赞!我的同事入选福布斯了

望繁信科技

数字化转型 流程挖掘 流程资产 流程智能 望繁信科技

镜舟科技荣获中国信通院 2024 OSCAR 尖峰开源商业化案例奖

镜舟科技

开源 分析型数据库 StarRocks

基于CRISPRCas9技术开发的用于肿瘤突变负荷(TMB)测量的新型FFPE

INSVAST

数据分析 基因数据分析 生信服务

RTE 2024 隐藏攻略

声网

鸿蒙新世界亮点聚焦:华为阅读APP升级精品书探索阅读新潮流

最新动态

Linux运行时动态库搜索路径优先级

不在线第一只蜗牛

Linux 运维 1024程序员节

“2024,我想和 TDengine 谈谈”征文活动获奖名单揭晓!

TDengine

数据库 tdengine 时序数据库

Zabbix 数据对接观测云最佳实践

观测云

zabbix

YAML文件格式校验:免费API使用技巧

幂简集成

API yaml

鸿蒙新世界迎华为阅读重大升级:让电子书也能读出纸书沉浸感

最新动态

如何衡量研发效能度量的价值?

思码逸研发效能

DevOps 研发效能 效能度量 研发效能度量 思码逸

LeetCode题解:2357. 使数组中所有元素都等于零,排序,详细注释

Lee Chen

50万奖金池!开放原子大赛——第二届OpenHarmony创新应用挑战赛正式启动

OpenHarmony开发者

OpenHarmony

16年后,“双11”被推翻重来

趣解商业

淘宝 电商 京东 双十一

鸿蒙应用示例:仿钉钉日历新建日程

zhongcx

合合信息:生成式Al时代的内容安全与系统构建加速,开启智能文档的全新潜能

阿Q说代码

内容安全 智能文档

微软Azure Neural TTS 新增对9个“小语种”语言及口音支持 | InfoQ快讯_AI&大模型_刘燕_InfoQ精选文章