使用 Amazon Polly 提供实时家居监控警报_语言 & 开发_亚马逊云科技 (Amazon Web Services）

AI实践哪家强？来 AICon，解锁技术前沿，探寻产业新机！了解详情 



 写点什么

这是 Y-cam Solution 高级开发人员 Siva K. Syamala 撰写的客座博客文章。用她自己的话说，“Y-cam 是高质量安保视频解决方案提供商，我们的愿景是让智能家居安防系统变得简单，方便所有人使用。” | 原文链接

家居安防是家庭自动化和物联网的重要组成部分。Y-cam Solutions Limited 在 Amazon 的大力支持下，提供了一个智能安防系统，该系统可通过智能手机在世界任何地方进行监视和控制。为了改进警报、通知和系统控制方式，Y-cam 使用 Amazon Polly 提供一流的 AI 服务。利用该服务，用户可通过语音与安防系统进行交互。

我们的服务的工作方式

当触发报警时，我们通过 Twilio 以语音电话的方式通知客户。在建立呼叫后，Twilio 将逐步执行 TwiML 指令，并使用从 Amazon Polly 检索的合成语音开始向客户传送信息。电话接听方通过按手机键盘上的按钮 (DTMF 代码) 来做出回应。根据具体的 DTMF 代码，我们的服务会采取指定的操作，并返回从 Amazon Polly 检索的合成语音所对应的 TwiML 指令。为了让用户听起来像一个真实的对话，Amazon Polly 必须快速做出回应。延迟和等待会让人不满，并更有可能会导致接听方挂断电话。

下面是触发警报时向客户拨打的电话的示例音频剪辑。

##架构

呼叫 Amazon Polly

以下 Java 代码说明了从 Amazon Polly 请求合成语音并将其存储在 S3 存储桶中的过程。

public String convertTextToSpeech(final String text, final String polyVoiceId) {  log.info("Converting " + text + " to speech");  // Create speech synthesis request.  SynthesizeSpeechRequest synthesizeSpeechRequest = new SynthesizeSpeechRequest()  .withText(text)  .withVoiceId(polyVoiceId)  .withOutputFormat(OutputFormat.Mp3);
  // Get the synthesized speech audio stream.  SynthesizeSpeechResult synthesizeSpeechResult = awsPollyClient.synthesizeSpeech(synthesizeSpeechRequest);      // store audio stream of Polly to S3 as an MP3 file  byte[] bytes = null;  try {    bytes = IOUtils.toByteArray(synthesizeSpeechResult.getAudioStream());  } catch (IOException e) {    log.error("Could not get bytes from the audio stream " + e.getMessage());  }      ObjectMetadata omd = new ObjectMetadata();  omd.setContentType(synthesizeSpeechResult.getContentType());  omd.setContentLength(bytes.length);  ByteArrayInputStream byteArrayInputStream = new ByteArrayInputStream(bytes);  String fileName = getRandomString();  final PutObjectRequest s3Put = new PutObjectRequest(pollySpeechBucket, fileName, byteArrayInputStream, omd).withCannedAcl(CannedAccessControlList.PublicRead);
  amazonS3Client.putObject(s3Put);
  return S3URL;}

复制代码

为什么选择 Amazon Polly？

在使用 Amazon Polly 之前，我们使用过另一家 TTS 提供商，该提供商提供的语音不真实，并且存在可扩展性问题。很显然，机器人的声音不会带来良好的客户体验。我们希望声音更加自然，更加接近人类声音。Amazon Polly 为我们提供了一个非常简单、灵活、自然和可扩展的文本到语音的解决方案，而且成本非常低。另外，Amazon Polly 还支持不同的语音和语言。Amazon Polly 可以在数毫秒内处理数据，这样我们的客户不需要长时间等待回应。

未来的发展

我们计划在未来使用 Amazon Lex，以便客户可以向自己的家居安防系统发出控制命令，而不是输入 DTML 代码。Amazon Lex 提供了自动语音识别 (ASR) 的深度学习功能，可将语音转换为文本；并且提供了自然语言理解 (NLU) 来识别文本的意思。我们的目标是为用户提供全语音用户接口。

本文转载自 AWS 技术博客。

原文链接：

https://amazonaws-china.com/cn/blogs/china/using-amazon-polly-to-provide-real-time-home-monitoring-alerts/

发布

暂无评论

创作场景

使用 Amazon Polly 提供实时家居监控警报

我们的服务的工作方式

呼叫 Amazon Polly

为什么选择 Amazon Polly？

未来的发展

评论

使用python校验密码强度

深入RocketMQ-消息原理篇

python入门之内置模块argparse

python将视频抽帧的的多种方式

国家级认证！青藤获得安全运营类一级资质

3DCAT教育合作伙伴招募 | 价值80w权益等你来，立享最高级别技术支持

python替换图片背景色，适用于制作证件照

python入门之时间处理日期库

使用python实现一个文件搜索功能,类似于Everything功能

记一次应用接入第三方统一认证服务的过程,基于JWT和OAuth2.0

专访超次元｜这家头部虚拟赛道公司，如何借助3DCAT加速元宇宙建设？

戴尔Latitude 3330，实用办公党，解放双肩包

python中的一个实用的库imghdr,用于探测图片格式

python入门之发送邮件

使用python生成文字图片，画圆圈，生成圆形图片

使用Idea搭建App开发环境，创建安卓工程

电网攻击频发，云原生架构正在成为众矢之的

两折！3DCAT实时渲染云超强算力帮你玩转元宇宙

windows机器配置自签名ssl证书，部署文件服务器

python入门之数据库操作

Java读取csv文件的三种方式

LED显示屏由什么组成？

使用python提供一个简单的restful接口

长安链源码分析之网络模块 net-liquid(5)

python版局域网端口扫描

Springboot项目启动后获取配置属性

使用python处理视频的库moviepy

python入门之os模块和platform模块

使用python监控linux服务器

【融云出海白皮书免费看】出海洞察之印尼的「新兴市场启示录」

等保合规是什么意思？怎么做？

创作场景

使用 Amazon Polly 提供实时家居监控警报

我们的服务的工作方式

呼叫 Amazon Polly

为什么选择 Amazon Polly？

未来的发展

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载