写点什么

用大模型自动做笔记、提取 PPT、整理访谈,阿里云 AI 新产品“通义听悟”开放公测

  • 2023-06-01
    北京
  • 本文字数:1245 字

    阅读完需:约 4 分钟

用大模型自动做笔记、提取PPT、整理访谈,阿里云AI新产品“通义听悟”开放公测

6 月 1 日,阿里云宣布通义大模型进展,聚焦音视频内容的 AI 新品“通义听悟”正式上线,开放公测。


继史无前例的大降价后,阿里云送出人人都能用上的 AI“大礼包”。此前国内语音厂商 AI 转写定价达 19.8 元每小时,而听悟用户可通过每日登陆等多种任务领取免费转写时长。公测期间,阿里云官方微博、微信及各大平台社区还会发放大量 20 小时转写口令码,用户获得的福利权益可累加,一年内有效,免费时长可高达 100 小时以上,市场价值上千元。公测期间,用户预估可领取 100 小时以上听悟免费转写时长。


据悉,通义听悟接入了通义千问大模型的理解与摘要能力,可成为用户工作学习中的得力 AI 助手,帮助随时随地高效完成对音视频内容的转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取 PPT 等。

 

“换一种方式,让音视频可以被轻松阅读、整理和分享。”阿里云 CTO 周靖人介绍,听悟是一款工作学习 AI 助手,它瞄准具有高知识附加值的音视频内容场景,比如开会、上课、访谈、培训、面试、直播、看视频、听播客等,能通过大模型等最新 AI 技术快速提炼和沉淀知识。   



据悉,听悟融合了十多项 AI 功能,可以全面提升知识从音视频向图文形态转化的效率。除了“听力好”,能高准确度生成会议记录、区分不同发言人,这个 AI 助手“悟性也高”,大模型可以一秒给音视频划分章节并形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项。大模型一键提取 PPT、针对多个音视频内容向 AI 提问、概括特定段落等功能近期也将上线。


通义听悟可自动为音视频生成全文摘要、章节概括、发言总结

 

针对一些细分场景,听悟还设置了不少“宝藏功能”:打开 Chrome 插件,外语学习者和听障人士可以借助双语悬浮字幕条随时随地看无字幕视频,日程冲突时,听悟还可成为职场人士的“开会替身”,在静音情况下入会 AI 可代为记录会议、整理要点;转写结果可下载为字幕文件,方便新媒体从业者视频后期制作;听悟梳理的问答回顾可以让记者、分析师、律师、HR 等群体整理访谈更高效。


通义听悟 Chrome 插件将在近期对所有用户开放下载

 

此外,听悟与阿里云盘打通,一键就能转写云盘上的音视频内容,公测期间注册的听悟用户后续还将获得更大的阿里云盘存储空间,在云盘内在线播放视频时也可自动出字幕。


通义听悟支持一键导入阿里云盘音视频文件

 

周靖人介绍,听悟集成了阿里最先进的语音和语言技术。其内置阿里新一代工业级语音识别模型,识别准确率在多个权威中文数据集上名列第一;融合自研语音语义多模态说话人算法,能对 10 人以上说话场景进行角色区分;接入通义千问大模型后,能够对上万字的音视频内容进行摘要总结,事实准确与要点完备性国内领先,支持跨多音视频内容的精准问答理解。

 

据了解,听悟除个人版本外,还有企业应用。此前,听悟企业版已在阿里集团内部被广泛使用,帮助减少了大量会议记录和整理的工作,受到好评。同时,听悟的能力也可嵌进各类音视频平台,形成实时字幕、智能摘要等,典型应用如钉钉的“钉闪记”背后便集成了听悟。未来听悟还将在夸克 APP、阿里云盘等端口提供服务。


“钉闪记”背后集成通义听悟

2023-06-01 11:363604

评论

发布
暂无评论
发现更多内容

为什么MatrixOne 0.5变慢了

MatrixOrigin

矩阵起源 MatirxOrigin MatirxOne 因子化

BulkProcessor异步批处理组件使用

大河

elasticsearch bboss bulkprocess

Kyligence 亮相 Gartner 2022 数据与分析峰会,解锁数据智能新潜力

Kyligence

数据管理 指标中台

技术分享 | 测试人员必须掌握的测试用例

霍格沃兹测试开发学社

GOPS现场 | 对话龙智董事长何明,探讨DevOps安全新概念

龙智—DevSecOps解决方案

运维 GOPS大会 GOPS全球运维大会

Elasticsearch添加修改删除索引文档

大河

elasticsearch bboss

【小程序】view视图,swiper轮播图,scroll-view滑动列表 (在线详细手册)

计算机魔术师

8月月更

leetcode 227. Basic Calculator II 基本计算器 II(中等)

okokabcd

LeetCode 算法与数据结构

入门机器学习?还是先抢救一下数学吧!

博文视点Broadview

技术分享 | 这些常用测试平台,你们公司在用的是哪些呢?

霍格沃兹测试开发学社

Tapdata 获得阿里云首批产品生态集成认证,携手阿里云共建新合作

阿里巴巴云原生

阿里云 Serverless 云原生 SAE 合作

蓝牙5.0简介、nRF52832 BLE样例工程框架及main函数初始化流程简析

矜辰所致

蓝牙 启动流程 8月月更 nRF52832

bboss数据同步ETL工具介绍

大河

elasticsearch ETL bboss

2022 世界人工智能大会|人工智能与开源技术先锋论坛即将开幕

Kyligence

开源技术 人工智能大会

兆骑科创人才引进服务平台,线上直播路演,投融资对接

兆骑科创凤阁

移动端App自动化之触屏操作自动化

霍格沃兹测试开发学社

厚积薄发--一文带您了解阿里云 RocketMQ 轻量版消息队列(MNS)

阿里巴巴云原生

阿里云 RocketMQ 云原生 消息队列

你还有什么问题吗?

AlwaysBeta

程序员 面试

兆骑科创创新创业服务平台,海内外高层次人才引进,赛事承办

兆骑科创凤阁

如何应对ITSM难题,打造现代化、高效的ITSM解决方案?

龙智—DevSecOps解决方案

ITSM ITSM软件 ITSM解决方案

校区多,客情管理难?看中进教育使用明道云的新解法

明道云

节能环保LED显示屏为什么是未来发展趋势?

Dylan

LED显示屏 led显示屏厂家

网络组件axios可以在OpenHarmony上使用了

OpenHarmony开发者

Open Harmony

最常见的两个Jenkins问题,以及解决方法

龙智—DevSecOps解决方案

ci CI/CD CI/CD管道

【小程序项目开发 --- 京东商城】 启航篇之uni-app项目搭建

计算机魔术师

8月月更

项目经理和ScrumMaster可以是同一个人吗?

ShineScrum捷行

Scrum 敏捷 ScrumMaster 项目经理

AntDB最新成果亮相全球分布式云大会,推动企业数字化变革深入

亚信AntDB数据库

AntDB

字节跳动基于 ClickHouse 优化实践之“查询优化器”

字节跳动数据平台

OLAP Clickhouse 查询优化 数据库开发 数据引擎

【小程序项目开发-- 京东商城】uni-app开发之配置 tabBar & 窗口样式

计算机魔术师

8月月更

NFT平台开发:NFT数字馆藏平台开发

开源直播系统源码

数字藏品软件开发 数字藏品开发 数字藏品系统

这份SVN命令备忘清单,请查收

龙智—DevSecOps解决方案

svn 版本控制系统

用大模型自动做笔记、提取PPT、整理访谈,阿里云AI新产品“通义听悟”开放公测_开源_InfoQ编辑部_InfoQ精选文章