写点什么

微软 Azure Neural TTS 新增对 9 个“小语种”语言及口音支持 | InfoQ 快讯

  • 2022-08-08
    北京
  • 本文字数:1395 字

    阅读完需:约 5 分钟

微软Azure Neural TTS 新增对9个“小语种”语言及口音支持 | InfoQ快讯

AI 语音技术的发展和应用,让中国用户在外语学习和对外沟通交流中获得了诸多便利。但对于国内的小语种学习者,或是正在小语种国家或地区开展业务的机构,目前还需要支持更多小语种的语音工具。


然而,由于缺乏训练数据,那些较少使用的口语,几乎没有任何可用的 TTS 工具。现在,在低资源TTS技术的支持下,微软 Azure 认知服务正在持续扩展对不同国家及地区语言的支持,满足更多用户的场景需求,例如小语种教育教学的有声读物、电子辞典等学习工具;面向相应国家和地区市场的 AI 语音助手、AI 语音客服;或是将 TTS 作为视频、音频等素材的生产工具,产出面向以上语种使用者的媒体产品等。


InfoQ 获悉,近期,微软 Azure Neural TTS 新增了对 9 个“小语种”语言及其不同口音的支持,包括:阿拉伯语(黎巴嫩)、阿拉伯语(阿曼)、阿塞拜疆语(阿塞拜疆)、波斯尼亚语(波黑)、格鲁吉亚语(格鲁吉亚)、蒙古语(蒙古)、尼泊尔语(尼泊尔)、阿尔巴尼亚语(阿尔巴尼亚)、泰米尔语(马来西亚)。以上几种语言均已公开发布,供开发者使用。


点击以下声音示例,感受这些不同风格的“小语种”语言。



示例:az-AZ BabekNeural 阿塞拜疆语(阿塞拜疆)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/az-AZ-BabekNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ar-LB RamiNeural 阿拉伯语(黎巴嫩)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ar-LB-RamiNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ne-NP SagarNeural 尼泊尔语(尼泊尔)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ne-NP-SagarNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:bs-BA VesnaNeural 波斯尼亚语(波黑)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/bs-BA-VesnaNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ta-MY KaniNaural 泰米尔语(马来西亚)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ta-MY-KaniNaural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


全球人类正在使用的语言有数千种,其中使用最多的前 1%(约 70 种语言)覆盖了全球 80%以上的人口,并且基本都得到了 TTS 技术的支持。但那些小语种的使用者,也应当享受 TTS 技术带来的便利。


图:微软 Azure Neural TTS 支持语言和声音列表


据悉,截止目前,Azure 认知服务的文本转语音模块支持全球140个国家和地区的语言,提供400个声音模型,企业能够利用Azure神经网络版声音定制服务,以多种语言和风格打造独特的品牌声音。微软 Azure AI 还提供语音转文本OCR翻译等一系列与语言相关的认知服务,所支持的语言已达 100 多种。

2022-08-08 18:334752
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 599.5 次阅读, 收获喜欢 1982 次。

关注

评论

发布
暂无评论
发现更多内容

准备3个月,面试10分钟,Java中高级岗面试为何越来越难?

Java架构师迁哥

本文是为了帮大家快速回顾了Java中高级知识点,只需收藏不用看!

Java架构师迁哥

建信金科大咖访谈:ISO20000及ISO27001标准体系解读

金科优源汇

centos7使用

xujiangniao

Linux

超全!阿里首发内部微服务架构笔记,再也不用为“微服务”苦恼了

Java架构师迁哥

用 CloudQuery 管理和操作数据库,更高效更安全

BinTools图尔兹

运维 dba 数据库管理工具

深入分析Linux操作系统对于TCP/IP栈的实现原理与具体过程

奔着腾讯去

c++ socket 网络协议

24道几乎必问的JVM面试题,我只会7道,你能答出几道?

北游学Java

Java 面试 JVM

程序员需要了解数据库知识么?

escray

学习 极客时间 朱赟的技术管理课 6月日更

我人生的里程碑之【作为独立开发者,第一次承接外包项目的心得经历,也许说出你的心声哦!】

码界西柚

程序人生 6月日更

在外包5年,每天读写删改,突然发现跳不出来了

Java架构师迁哥

一个超牛逼的 GitHub 项目,标星高达55.3Kstar,附项目源代码

Java架构师迁哥

《原则》(九)

Changing Lin

6月日更

如何判断老板是在给员工画饼?

石云升

创业 职场经验 6月日更

入职阿里定级P7,2021年最新最全180道高级岗面试题及答案

Java架构师迁哥

福利时刻 十年黑客大佬的Web安全渗透技术分享

学神来啦

Linux 黑客 安全 运维自动化

上架Steam一周的付费游戏,开源了!其实你能“薅”的不止一只羊

程序员生活志

从零开始学习3D可视化之模型动画

ThingJS数字孪生引擎

可视化 模型 大屏可视化 数字时代 3D可视化

油管视频下载: 如何下载油管视频到本地

科技猫

分享 教程 经验 油管视频下载 下载油管视频

Kubernetes学习笔记之Calico CNI Plugin源码解析(二)

360技术

创业邦南立新:搭建创新生态,是奔向万亿美金市值的必经之路

创业邦

涵盖了所有计算机底层知识总结与操作系统的实战教程,你确定不看看吗

Java架构师迁哥

☕️【Java 技术之旅】带你一起攻克String类创建的难点分析

码界西柚

Java string pool string 6月日更

开源之夏来啦,欢迎报名 Apache APISIX 项目!

API7.ai 技术团队

开源 后端 技术人生 API 网关

2021年最新版Java后端最全面试攻略,全面对标BATJ

Java 程序员 架构 面试

阿里工作8年,肝到P8就剩这份学习笔记了,已助朋友拿到10个Offer

Java 程序员 架构 面试

大厂招聘程序员都是“有章可循”你Get到了吗?

Java架构师迁哥

面试官:如何给字符串设计索引?

一个优秀的废人

MySQL 索引 字符串 索引优化

阿里云官方出品:全面总结阿里云云原生架构方法论与实践经验

尹文敏

云计算 阿里云 云原生

毕昇JDK:为啥是ARM上超好用的JDK

华为云开发者联盟

Java 华为 jdk Openjdk 毕昇 JDK

Flink + Iceberg 在去哪儿的实时数仓实践

Apache Flink

flink

微软Azure Neural TTS 新增对9个“小语种”语言及口音支持 | InfoQ快讯_AI&大模型_刘燕_InfoQ精选文章