【锁定直播】字节、华为云、阿里云等技术专家讨论如何将大模型接入 AIOps 解决实际问题,戳>>> 了解详情
写点什么

声网一站式智能语音识别方案升级 语音审核“快准省”

  • 2020-04-10
  • 本文字数:1899 字

    阅读完需:约 6 分钟

声网一站式智能语音识别方案升级 语音审核“快准省”

近日,我们的“一站式智能语音识别方案”将实现升级。升级后,在原有合作伙伴“数美科技”基础上,将新增依图、阿里云这两家智能语音识别服务商,通过整合行业 TOP3 服务商的语音识别技术优势,帮助直播、语音聊天室等互联网平台更智能、高效的识别语音中存在的涉黄、涉政、广告等不良信息,实现全面、深入地净化平台网络环境。


依图、阿里云重磅加入,智能语音识别方案升级

近年来,随着直播、短视频、语音社交等行业的快速发展,由用户创造的 UGC 内容成为了互联网内容生态的重要构成,并丰富了人们的互联网生活。而另一方面,随着用户 UGC 内容越来越多,涉黄、涉政、不良广告等违法、违规的内容也频频出现,成为了“害群之马”,给很多平台带来了风险。同时,相对于图文和视频,音频审核本身在技术上也更具难度,又增加了平台方的内容审核压力。


在去年 8 月,声网 Agora 就推出了“一站式智能语音识别方案”,为企业提供可集成实时音视频、实时录制和实时智能语音识别的一站式服务,在语音识别服务方面接入了数美科技的“天净”智能语音审核系统,通过声纹检测、语音识别等技术,智能识别语音环境中的涉黄、涉政、广告等违法违规信息,受到了很多企业的好评。


而此次升级后的“一站式智能语音识别方案”新增接入了阿里云、依图科技先进、智能的语音识别技术,整合了业界 TOP3 智能语音识别服务商的技术优势以提供目前互联网行业最全面、最高效的智能语音识别技术。例如,数美科技的“天净”智能语音识别,基于深度学习语音识别技术,多维度智能实时审核。深挖场景需求,为直播视频流、UGC 短视频、FM 电台、语音广场、语音直播间等各类场景提供智能内容过滤服务,通过语音识别转文本的方式,识别文本内容中涉政、色情、广告等不良信息;业内首创的娇喘语音识别,基于基于 Bi-GRU、Attention 模型,精准识别声音中含有娇喘、呻吟、耳骚、喊麦等违规音频,准确率达到 90%以上。声纹识别与检索对比”技术可进行声纹聚类、关联,发现线上、线下语音广告与欺诈行为等。


而依图科技在公共安全领域早已深耕多年。依靠世界级算法团队自研的语音识别、自然语言理解和声纹算法,依图的“智能语音审核”拥有准、快、省三大特点。准——凭借世界级算法能力加已有场景数据的螺旋迭代提升,依图的召回和准确率居行业前列,帮企业最大程度的降低风险。快——实时监测并在 3 秒内返回结果。省——同步返回高精准转写文本和违规音频片段,帮人工审核员提高效率、节省时间。


打通实时音视频+智能语音识别+AI,企业一站式接入

声网 Agora 的“一站式智能语音识别方案”可为企业提供实时音视频+实时录制+实时智能语音识别的一站式高度集成服务,也是目前唯一一家打通人工智能、实时语音识别、实时音视频三大技术解决方案的服务商。使用声网的一站式服务,企业无需部署额外 SDK、无需自己对接 CDN 厂商、更无需支付拉流成本,就可同时上线直播(实时音视频)和鉴黄(实时语音识别)功能,帮助企业大幅节省接入成本,真正做到一站式方便接入。


在智能语音识别方面,声网 Agora 整合了业界 TOP3 智能语音识别服务商的技术优势。而在实时音视频功能方面,声网自建的软件定义实时网 SD-RTN™专为实时音视频业务提供 SLA/ QoS 质量保证,能为企业提供高并发、高可靠性、低延时和抗弱网等特性的实时音视频技术。


声网 Agora 目前在全球拥有 250 多个数据中心。在网络架构设计上能够应对 10 倍以上的负荷,具备千万级并发能力。声网的软件定义实时网 SD-RTN™拥有超低延时特性,可做到全球端到端延时小于 400ms,延时中位数 76ms,处于行业领先水平。声网还具备优秀的弱网传输和抗丢包算法,可以在 60%的丢包环境下保障音视频流畅,70%的网络丢包环境下保障语音的流畅。在终端性能和适配方面,声网针对实时互联网 last mile 做了深度优化,目前已经适配 6000 多款终端设备,网络覆盖全球 200 多个国家和地区,即使在网络环境差的偏远山区或跨国场景中用户也能实现顺畅互动。


此外,对于语音识别中常见的噪声、背景音等音质问题,声网的一站式智能语音识别解决方案还融合声网 Agora 语音引擎与 AI 音频降噪算法,可提供去除背景音、环境音之后的高音质音频源,在原来算法的基础上将不良信息的识别率有效提高 30% 以上。


通过声网 Agora 的“一站式智能语音识别方案”可以帮助企业严格、有效的净化平台内容质量,降低监管风险,提升用户体验,同时还能为企业大幅节省接入成本。据了解,接下来声网还将联合更多业界知名智能语音识别服务商,为企业持续提供业界最高效、最严格的内容审核机制,促进网络生态健康发展。


本文转载自 声网 Agora 公众号。


原文链接:https://mp.weixin.qq.com/s/A7lL1FYdUfru3-TELGOqLA


2020-04-10 17:38615

评论 1 条评论

发布
暂无评论
发现更多内容

和另一半过不一样的520

小英

520单身福利 520 单身福利

开发中Docker常用容器记录

Docker

模块四-千万级学生管理系统试卷存储方案

华仔架构训练营

基于Mac的手动搭建WordPress个人站点的方法

三掌柜

5月日更

Python 持久化 - 文件

若尘

文件 持久化 持久化存储 5月日更

Go 并发编程-goroutine 初体验

Rayjun

Go 语言 goroutine

另一种方式实现事务码SE16里的结果集修改

Jerry Wang

JavaScript SAP Fiori

架构实战营-作业四

大可

MySQL主从网络延迟解决方案

运维研习社

MySQL 运维 主从同步 5月日更

架构实战营模块4作业

Vic

架构实战营

Inner Join, Left Outer Join和Association的区别

Jerry Wang

SAP abap ST05

SAP 不同 ABAP 系统里同一 Customizing activity 的显示差异分析

Jerry Wang

CRM SAP ERP abap 定制化

到底哪种类型的错误信息会阻止business transaction的保存

Jerry Wang

CRM SAP abap

一个查看 SAP UI5 控件所有公有方法的小技巧

Jerry Wang

JavaScript SAP SAP UI5

高性能 JavaScriptの五 -- 快响应用户界面

空城机

JavaScript 大前端 5月日更

再谈前端性能监控及4个最佳工具分享

devpoint

大前端 sentry

☕【Java技术之旅】从底层角度去认识线程的原理

洛神灬殇

Java 线程 Thread 线程协作 5月日更

C4C Cloud Application Studio做ABSL开发的一些性能方面的最佳实践

Jerry Wang

Cloud CRM SAP C4C

如何在SAP CRM WebClient UI里创建HANA Live Report

Jerry Wang

CRM SAP WebClient UI

SAP Fiori Launchpad Tile点击后跳转的调试技巧

Jerry Wang

JavaScript SAP Fiori SAP UI5

Authorization object在哪些ABAP代码里使用到

Jerry Wang

CRM SAP abap Netweaver

Shell脚本-简单爬虫

追风的少年

找出 SAP OData service出错根源的小技巧

Jerry Wang

SAP Fiori SAP UI5 OData

如何根据日志来了解一个请求经历了什么?

我爱娃哈哈😍

软件架构 架构设计 架构实战

设计千万级学生管理系统的考试试卷存储方案

9527

🚄【Redis 干货领域】帮你完全搞定 Cluster 原理(实践篇)

洛神灬殇

redis redis集群 redis cluster 5月日更 redis架构

自我复盘

lenka

5月日更

如何将BSP应用配置成Fiori Launchpad上的一个tile

Jerry Wang

SAP abap Fiori SAP UI5 bsp

SAP Fiori 应用 Footerbar 区域按钮的高亮显示逻辑

Jerry Wang

JavaScript SAP Fiori SAP UI5

利用Chrome的Heap Snapshot功能分析一个时间段内的内存占用率

Jerry Wang

JavaScript chrome

Go 并发编程 — 深入浅出 sync.Pool ,围观最全的使用姿势,理解最深刻的原理

奇伢云存储

并发编程 云存储 Go 语言

声网一站式智能语音识别方案升级 语音审核“快准省”_文化 & 方法_声网_InfoQ精选文章