【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

用大模型自动做笔记、提取 PPT、整理访谈,阿里云 AI 新产品“通义听悟”开放公测

  • 2023-06-01
    北京
  • 本文字数:1245 字

    阅读完需:约 4 分钟

用大模型自动做笔记、提取PPT、整理访谈,阿里云AI新产品“通义听悟”开放公测

6 月 1 日,阿里云宣布通义大模型进展,聚焦音视频内容的 AI 新品“通义听悟”正式上线,开放公测。


继史无前例的大降价后,阿里云送出人人都能用上的 AI“大礼包”。此前国内语音厂商 AI 转写定价达 19.8 元每小时,而听悟用户可通过每日登陆等多种任务领取免费转写时长。公测期间,阿里云官方微博、微信及各大平台社区还会发放大量 20 小时转写口令码,用户获得的福利权益可累加,一年内有效,免费时长可高达 100 小时以上,市场价值上千元。公测期间,用户预估可领取 100 小时以上听悟免费转写时长。


据悉,通义听悟接入了通义千问大模型的理解与摘要能力,可成为用户工作学习中的得力 AI 助手,帮助随时随地高效完成对音视频内容的转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取 PPT 等。

 

“换一种方式,让音视频可以被轻松阅读、整理和分享。”阿里云 CTO 周靖人介绍,听悟是一款工作学习 AI 助手,它瞄准具有高知识附加值的音视频内容场景,比如开会、上课、访谈、培训、面试、直播、看视频、听播客等,能通过大模型等最新 AI 技术快速提炼和沉淀知识。   



据悉,听悟融合了十多项 AI 功能,可以全面提升知识从音视频向图文形态转化的效率。除了“听力好”,能高准确度生成会议记录、区分不同发言人,这个 AI 助手“悟性也高”,大模型可以一秒给音视频划分章节并形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项。大模型一键提取 PPT、针对多个音视频内容向 AI 提问、概括特定段落等功能近期也将上线。


通义听悟可自动为音视频生成全文摘要、章节概括、发言总结

 

针对一些细分场景,听悟还设置了不少“宝藏功能”:打开 Chrome 插件,外语学习者和听障人士可以借助双语悬浮字幕条随时随地看无字幕视频,日程冲突时,听悟还可成为职场人士的“开会替身”,在静音情况下入会 AI 可代为记录会议、整理要点;转写结果可下载为字幕文件,方便新媒体从业者视频后期制作;听悟梳理的问答回顾可以让记者、分析师、律师、HR 等群体整理访谈更高效。


通义听悟 Chrome 插件将在近期对所有用户开放下载

 

此外,听悟与阿里云盘打通,一键就能转写云盘上的音视频内容,公测期间注册的听悟用户后续还将获得更大的阿里云盘存储空间,在云盘内在线播放视频时也可自动出字幕。


通义听悟支持一键导入阿里云盘音视频文件

 

周靖人介绍,听悟集成了阿里最先进的语音和语言技术。其内置阿里新一代工业级语音识别模型,识别准确率在多个权威中文数据集上名列第一;融合自研语音语义多模态说话人算法,能对 10 人以上说话场景进行角色区分;接入通义千问大模型后,能够对上万字的音视频内容进行摘要总结,事实准确与要点完备性国内领先,支持跨多音视频内容的精准问答理解。

 

据了解,听悟除个人版本外,还有企业应用。此前,听悟企业版已在阿里集团内部被广泛使用,帮助减少了大量会议记录和整理的工作,受到好评。同时,听悟的能力也可嵌进各类音视频平台,形成实时字幕、智能摘要等,典型应用如钉钉的“钉闪记”背后便集成了听悟。未来听悟还将在夸克 APP、阿里云盘等端口提供服务。


“钉闪记”背后集成通义听悟

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-06-01 11:363089

评论

发布
暂无评论
发现更多内容

BIGO 如何做到夜间同时运行 2.4K 个工作流实例?

Apache DolphinScheduler

spark 工作流调度 Apache DolphinScheduler 离线计算

架构实战营 10 期 - 作业 6

炮仗

化繁为简|中信建投基于StarRocks构建统一查询服务平台

StarRocks

数据库 大数据 开源

新书上市 | 以过去预测未来,有趣的时间序列

图灵社区

机器学习 统计学 时间序列 时间序列预测

启科量子解决方案实践:使用QuTrunk+AWS Deep Learning AMI(TensorFlow2)构建量子神经网络

启科量子开发者官方号

人工智能 量子计算

Top 5 OSSInsight 年度最佳 MLOps 开源工具

Jina AI

深度学习 开源框架 Jina MLOps OSSInsight.io

关于Zebec生态的改进提案,以及即将上线的 Nautilus 链

BlockChain先知

基于流量双发平台的高效回归方案

网易云信

反垃圾 业务集群

浅谈 2022 前端工作流中全流程多层次的四款测试工具

Liam

前端 测试 前端开发 测试工具 测试开发

真正的低代码平台

陈飞

PaaS SaaS 低代码平台

Apache RocketMQ 入选 SegmentFault 年度中国技术品牌影响力企业榜单!

阿里巴巴云原生

阿里云 Apache RocketMQ

算力新话题,畅聊算力之新民生

鲸品堂

算力网络 企业号 2 月 PK 榜

Sugar BI 增强分析能力全场景解析

XxinQi

数据分析 可视化 BI 商务智能 预测模型

上海前端培训学习的就业前景

小谷哥

点对点传输现状,镭速高速点对点传输解决方案

镭速

谷歌用Bard打响了Chat GPT的第一枪,百度版Chat GPT 何时出炉?

蓝海大脑GPU

分红派息合约的函数逻辑是怎么实现的?附分红合约代码及教程

加密先生

RocketMQ 监控告警:生产环境如何快速通过监控预警发现堆积、收发失败等问题?

阿里巴巴云原生

阿里云 RocketMQ 云原生

前端报表如何实现无预览打印解决方案或静默打印

葡萄城技术团队

《流浪地球2》“数字生命”最后一秒拯救人类,现实中AI也正在“长出”灵魂

硬科技星球

设计模式-工厂方法模式和抽象工厂模式

C++后台开发

数据结构 设计模式 后端开发 Linux服务器开发 C++开发

在这些工厂、农田、服务区,看到智能中国的草蛇灰线

脑极体

人工智能 华为 许昌

程序员必备的数据库知识 2:Join 算法

NineData

数据库 程序员 join SQL sever NineData

单体应用、SOA、微服务,优劣势都有哪些?

FinFish

微服务 微服务架构 前端开发 移动开发 小程序化

Go1.20新版本正式发布,新特性值得一看

王中阳Go

Go golang 高效工作 学习方法

UE干货| UE虚幻引擎调试神器—控件反射器

3DCAT实时渲染

游戏开发 虚幻引擎 ue 游戏开发引擎

速剖架构(一)-- 流量的自然走向

Dinfan

架构设计

新书上市 | 以过去预测未来,有趣的时间序列

图灵教育

机器学习 统计学 时间序列 时间序列预测

可路由计算引擎实现前置数据库

石臻臻的杂货铺

数据库

CNStack 2.0:云原生的技术中台

阿里巴巴云原生

阿里云 云原生 技术中台

干货分享 | 3个Zbrush实用减面工具分享

3DCAT实时渲染

3D渲染 3D模型

用大模型自动做笔记、提取PPT、整理访谈,阿里云AI新产品“通义听悟”开放公测_开源_InfoQ编辑部_InfoQ精选文章