亮网络解锁器,解锁网络数据的无限可能 了解详情
写点什么

用大模型自动做笔记、提取 PPT、整理访谈,阿里云 AI 新产品“通义听悟”开放公测

  • 2023-06-01
    北京
  • 本文字数:1245 字

    阅读完需:约 4 分钟

用大模型自动做笔记、提取PPT、整理访谈,阿里云AI新产品“通义听悟”开放公测

6 月 1 日,阿里云宣布通义大模型进展,聚焦音视频内容的 AI 新品“通义听悟”正式上线,开放公测。


继史无前例的大降价后,阿里云送出人人都能用上的 AI“大礼包”。此前国内语音厂商 AI 转写定价达 19.8 元每小时,而听悟用户可通过每日登陆等多种任务领取免费转写时长。公测期间,阿里云官方微博、微信及各大平台社区还会发放大量 20 小时转写口令码,用户获得的福利权益可累加,一年内有效,免费时长可高达 100 小时以上,市场价值上千元。公测期间,用户预估可领取 100 小时以上听悟免费转写时长。


据悉,通义听悟接入了通义千问大模型的理解与摘要能力,可成为用户工作学习中的得力 AI 助手,帮助随时随地高效完成对音视频内容的转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取 PPT 等。

 

“换一种方式,让音视频可以被轻松阅读、整理和分享。”阿里云 CTO 周靖人介绍,听悟是一款工作学习 AI 助手,它瞄准具有高知识附加值的音视频内容场景,比如开会、上课、访谈、培训、面试、直播、看视频、听播客等,能通过大模型等最新 AI 技术快速提炼和沉淀知识。   



据悉,听悟融合了十多项 AI 功能,可以全面提升知识从音视频向图文形态转化的效率。除了“听力好”,能高准确度生成会议记录、区分不同发言人,这个 AI 助手“悟性也高”,大模型可以一秒给音视频划分章节并形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项。大模型一键提取 PPT、针对多个音视频内容向 AI 提问、概括特定段落等功能近期也将上线。


通义听悟可自动为音视频生成全文摘要、章节概括、发言总结

 

针对一些细分场景,听悟还设置了不少“宝藏功能”:打开 Chrome 插件,外语学习者和听障人士可以借助双语悬浮字幕条随时随地看无字幕视频,日程冲突时,听悟还可成为职场人士的“开会替身”,在静音情况下入会 AI 可代为记录会议、整理要点;转写结果可下载为字幕文件,方便新媒体从业者视频后期制作;听悟梳理的问答回顾可以让记者、分析师、律师、HR 等群体整理访谈更高效。


通义听悟 Chrome 插件将在近期对所有用户开放下载

 

此外,听悟与阿里云盘打通,一键就能转写云盘上的音视频内容,公测期间注册的听悟用户后续还将获得更大的阿里云盘存储空间,在云盘内在线播放视频时也可自动出字幕。


通义听悟支持一键导入阿里云盘音视频文件

 

周靖人介绍,听悟集成了阿里最先进的语音和语言技术。其内置阿里新一代工业级语音识别模型,识别准确率在多个权威中文数据集上名列第一;融合自研语音语义多模态说话人算法,能对 10 人以上说话场景进行角色区分;接入通义千问大模型后,能够对上万字的音视频内容进行摘要总结,事实准确与要点完备性国内领先,支持跨多音视频内容的精准问答理解。

 

据了解,听悟除个人版本外,还有企业应用。此前,听悟企业版已在阿里集团内部被广泛使用,帮助减少了大量会议记录和整理的工作,受到好评。同时,听悟的能力也可嵌进各类音视频平台,形成实时字幕、智能摘要等,典型应用如钉钉的“钉闪记”背后便集成了听悟。未来听悟还将在夸克 APP、阿里云盘等端口提供服务。


“钉闪记”背后集成通义听悟

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-06-01 11:363115

评论

发布
暂无评论
发现更多内容

Week 11命题作业

Jeremy

Flink的2种部署模式-2

小知识点

scala 大数据 flink

一看就懂的三次握手

书旅

TCP 三次握手 操作系统 协议族

Docker 的前世今生

哈喽沃德先生

Docker 容器 微服务 虚拟化

一文读懂jar包的小秘密

程序那些事

Java jar jar包的小秘密 java解密

Centos7下service配置知识

Python中的bytes、str以及unicode区别

王坤祥

Python Python PEP

简单交互式页面的思考(C)

Alex

指针 C语言 交互设计

如何通过技术面试?

escray

学习 面试

我喜欢的工作,喜欢我么?

escray

学习 面试

SpreadJS 应用案例:电力自动化在线数据采集报表系统

葡萄城技术团队

SpreadJS 电力 报表

Week 11 学习总结

Jeremy

四十不惑,准备面试

escray

学习 面试

究竟要找什么样的工作?

escray

学习 面试

大数据技术发展(三):Spark 代替 Hadoop ? Spark Or Flink ?

cristal

Java 大数据 flink hadoop spark

我以后去做什么,技术还是业务?

escray

学习 面试 职业规划

一个@Transaction哪里来这么多坑?

程序员DMZ

spring 事务 读写分离

对于结果不同程度的追求,决定了这个人的身价

非著名程序员

程序员 个人成长 思维模型 结果思维

联邦学习初识

soolaugust

学习

a站、b站、c站、d站、e站、f站、g站、h站、i站、j站、k站、l站、m站、n站…z站?

程序员生活志

如何使 Grafana as code

郭旭东

翻译 Grafana

公司想要大龄程序员么?

escray

学习 面试

终于可以职业规划了么?

escray

学习 面试

【Elasticsearch 技术分享】—— Elasticsearch ?倒排索引?这都是什么?

程序员小航

elasticsearch ELK 倒排索引 ES 技术分享

再见C++

Sunny.

c++ 踩坑

我是合适的人选么?

escray

学习 面试

性能全开的十代酷睿,造就惠普光影精灵 6 的电竞燃魂

最新动态

MySQL系列(一):MySQL深入学习先导篇之基础架构

z小赵

MySQL 数据库

3 分钟生成一个单元测试报告,这个样式爱了

程序员小富

Java 测试

搞一搞Elasticsearch

北漂码农有话说

星火PLUS交易所打造无边界数字经济联盟,掀起币圈追捧热潮

InfoQ_967a83c6d0d7

用大模型自动做笔记、提取PPT、整理访谈,阿里云AI新产品“通义听悟”开放公测_开源_InfoQ编辑部_InfoQ精选文章