亮网络解锁器,解锁网络数据的无限可能 了解详情
写点什么

2023 IDEA 大会开幕,共探 AI 新篇章下的技术创新与创业

  • 2023-11-22
    北京
  • 本文字数:2911 字

    阅读完需:约 10 分钟

大小:1.46M时长:08:28
2023 IDEA大会开幕,共探AI新篇章下的技术创新与创业

11 月 22 日,AI 与数字经济领域一年一度的科创盛会,2023 IDEA 大会在深圳举行。IDEA 研究院创院理事长、美国国家工程院外籍院士沈向洋在会上发表主旨演讲,发布 IDEA 研究院的重磅研产结晶与市场化成果;在大咖云集的论坛环节,多位领军科学家、企业家、创业者同台论道,碰撞“学研产投”灵感。



2023 年,AI 技术给人类生活所带来的撼动已无需赘言。一个个看似散点状的技术突破相继爆发,将人工智能推向主流。回顾历史,技术变革无疑都伴随着产业重塑与经济发展。然而,AI 在以前所未有的力度冲入市场的同时,在研究上仍存在大量空白。


此次 IDEA 大会上,沈向洋从技术创新、技术创业、技术驱动新产业三个角度,介绍了 IDEA 研究院在 AI 新篇章下,对科创的实践与思考。


技术创新:见其所见,思所未思


谈及技术创新,沈向洋认为,“在大家都看到的问题里,找到大家都找不到的方法”是创新者的必备品质。本次大会上,IDEA 研究院就发布了几项独具技术品味的研究成果。

视觉提示模型 T-Rex


用图片代替语言 prompt,是什么体验?


在计算机视觉领域,检测类任务有着极为广泛的应用场景。今年 4 月,IDEA 研究院曾推出能够“一句话检测、分割一切”的 Grounded SAM,通过文字提示实现精准的目标检测,极大降低了技术使用与落地门槛,在 Github 上火爆出圈。


此次,同个研究团队带来新作,视觉提示(visual prompt)模型 T-Rex。团队表示,在真实应用场景中,许多罕见、复杂物体难以用文字充分描述,视觉提示的加入能够有效解决这一痛点。直观的视觉反馈与强交互性,也有助于提升检测的效率和精准度。



值得一提的是,T-Rex 是一个开箱即用的模型,无需重新训练或微调,即可检测模型在训练阶段从未见过的物体。活动中,沈向洋还发布了 T-Rex 的模型实验室(playground),Interactive Visual Prompt(iVP),用户可亲自试玩解锁“一图胜千言”的 prompting 新体验。


沈向洋在演讲中指出,计算机视觉领域在呼唤通用大模型的来临。以 GPT-4V 为代表的多模态大模型,是在语言能力上增加视觉能力;IDEA 研究院的计算机视觉团队则选择了另一条路径,先将基础的视觉能力做到极致,再增加语言能力。



“我们认为,物体级别的理解(object-level understanding),也就是检测、分割、识别,是连接语言和视觉这两种最重要的模态的基石。”沈向洋表示,只有对物理世界有了更为精准的、物体级别的视觉理解,才有可能做出真正的多模态智能。IDEA 团队将通过让模型言之有据(grounded)、开放词表(open-set)、可提示交互(promptable),来探索视觉大模型之路。

Think-on-Graph 知识驱动大模型


大模型虽好,但“一本正经的胡说八道”怎么解?


众所周之,大模型存在深度推理能力差、知识不可追溯、实时更新代价高等局限性,这也成为其在许多严肃领域落地的主要瓶颈。如何弥补大模型的这部分缺陷,是当下 AI 应用的重要课题。


为此,IDEA 研究院团队研发了 Think-on-Graph(思维图谱)技术,让大模型和知识图谱强强联合。总体来说,大模型更擅长意图理解和自主学习;而知识图谱因其结构化的知识存储方式,擅长逻辑链条推理,具有更佳的可解释性与可实时更新性。



Think-on-Graph 通过实现两者的紧耦合交互,驱动大模型 agent 在知识图谱上“思考”,逐步搜索推理出最优答案(在知识图谱的关联实体上一步一步搜索推理)。每一步推理中,大模型都亲自参与,与知识图谱相互取长补短。


在大会现场,研究团队也通过多个实例与产业化场景演示,展示了 Think-on-Graph 应对复杂提问时优异的深度推理能力。

懂语言者得天下


除了在人工智能方向上一往无前,IDEA 研究院还十分重视计算机科学领域中其他分支的创新。沈向洋在会上重点介绍了两个语言类项目。



今年 8 月,一个中国团队开发的编程语言在 Hacker News(由 Y Combinator 创办的知名科创社区)登上头版头条,这正是由 IDEA 研究院推出的 MoonBit 月兔。



IDEA 研究院展示的另一门新语言,是区块链并行智能合约语言 GCL。该语言的研究团队已连续两年获批国家重点研发计划项目。

 

GCL 旨在打造区块链系统上的最优解决方案。不同于传统的“数据跟着代码跑”的方案,GCL 设计了“代码执行跟着数据跑”的编程模型,以减少因数据传递造成的麻烦。分布式编程模型能够实现复杂的区块链应用逻辑,并高效适配底层的多链系统。


技术创业:自由碰撞,严谨产出


近年来,技术创业已然成为许多技术创新者的下一站。在演讲中,沈向洋用 Transformer 架构开山之作《Attention is All You Need》举例,这篇论文的八名作者如今全部在创业。“很多我的前同事也找到我说,‘Harry,我想创业’。”他打趣道。


沈向洋指出,IDEA 研究院一直致力于创造一个架构,让科学家头脑、企业家素质、创业者精神能够自由碰撞,严谨产出。成立刚满三年,IDEA 研究院也带来一批已经或正在走向大市场的优秀创业项目。



这些项目中,既有主打 AI for Scientists 的 AI 科研产品 ReadPaper,也有为数据要素可信流通提供硬件级安全保障的 SPU 机密计算协处理器、SPU-G 异构 AI 协处理器,还有基于自研知识图谱与生物医学领域大模型的脑卒中智能防护产品 StroCare。


其中,AI 科研助手 ReadPaper 上线一年,收获了不少科研从业者的喜爱。在大会上,团队公开了全新升级的 ReadPaper 2.0 版本,并现场演示阅读 copilot、润色 copilot 等新功能。值得一提的是,支撑 ReadPaper 2.0 超强体验的学术大模型 Eureka 也在现场首次公开。



除了让跨学科、跨界人才在 IDEA 的平台上碰撞出火花,IDEA 也积极与产业伙伴合作,将技术应用到场景,深入到业务中去。


今年,万科 IDEA 联合实验室推出了自主研发的几何建模与约束引擎,填补在工业设计软件领域的国产空白。自 2021 年宣布成立以来,该实验室已在深圳、上海建设起一支集合图像学、几何计算、视觉技术、机器学习等领域顶尖人才的研究队伍。


此外,IDEA 研究院还通过 CTO Labs 平台与一批独角兽企业和瞪羚企业联合创新,合作伙伴包括数说故事、晶泰科技、翼方健数等。本次 IDEA 大会上,IDEA 视见睿来实验室发布了 HiveNet 可控人像视频生成平台,实现 AI 技术方案对传统视频拍摄流程(编、导、拍、演、剪)的全面替代。


技术驱动新产业:勇闯无人区,低空经济再进一步


2022 年的 IDEA 大会上,沈向洋发布《低空经济发展白皮书——深圳方案》,吹响 IDEA 勇闯低空无人区的号角。


过去一年,低空经济在全国发展迅猛,IDEA 研究院也再进一步,在其智能融合低空系统(Smart Integrated Lower Airspace System,SILAS)中,提出时空进程(Temporal Spatial Process)新概念。


与此同时,《低空经济发展白皮书(2.0)——全数字化方案》也在活动上发布。



11 月 23 日,由 IDEA 研究院联合承办的第五届世界科技与发展论坛——世界低空经济论坛将在深圳举行。届时,IDEA 研究院将深度分享“异构、高密度、高频次、高复杂度”低空飞行安全和效率问题的解决思路,以及低空空域实现从“可通达”到“可计算”再到“可运营”转变的数字化路径。


“技术创新从来就不是一蹴而就的。”沈向洋说,人类历史就是一部勇闯无人区的历史,当我们回顾那些伟大的创新,今天看来有多震撼,起步时就有多困难。因此,做科研既要有耐心,也要对趋势有足够深刻的思考,还要建立让创新能够开枝散叶、生生不息的机制。演讲的最后,沈向洋呼吁,生逢大时代,IDEA 研究院愿与各界同仁一道,创新智能技术,创造伟大企业,推动数字经济。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-11-22 17:546601
用户头像
蔡芳芳 InfoQ主编

发布了 781 篇内容, 共 498.0 次阅读, 收获喜欢 2750 次。

关注

评论

发布
暂无评论
发现更多内容

OpenHarmony移植:如何适配utils子系统之KV存储部件

华为云开发者联盟

LiteOS OpenHarmony utils KV存储部件

详解基于机器学习的恶意代码检测技术

华为云开发者联盟

机器学习 深度学习 静态分析 恶意代码 恶意代码检测

微服务用户为什么要用云原生网关

阿里巴巴云原生

阿里云 Kubernetes 微服务 云原生网关

Hoo 交易所虎符研究院 ∣ 如何对NFT进行估值

区块链前沿News

NFT 虎符 Hoo 虎符交易所 虎符研究院

几纳米间风云:手机摄影的制高点争夺战

脑极体

网络安全必学渗透测试流程

网络安全学海

黑客 网络安全 信息安全 渗透测试 安全漏洞

java商城源码(servlet,springboot,html,vue,uniapp,小程序,android)一套任意组合

清风

计算机毕业设计 java商城 java商城源码 商城毕业设计源码

回声嘹亮 之 Go 的 Echo 框架 —— 上手初体验

宇宙之一粟

Go web Go 语言 2月月更

MySQL是怎么保证redo log和binlog是完整的?

华为云开发者联盟

MySQL Binlog Redo Log WAL机制 日志逻辑序列号

网络安全kali渗透学习 web渗透入门 Metasploit基本使用方法

学神来啦

2022中国化妆品行业发展趋势洞察

易观分析

化妆品行业

关于SaaS的内容营销策略(15/100)

hackstoic

营销 SaaS平台

保证业务高效运营 专有云虚拟网络是关键

百度开发者中心

【Python】第三章(string)

謓泽

Python 2月月更

资本热衷的垂直SaaS,如何能大有作为?

ToB行业头条

视频图像色彩增强的主要方法与落地实践

声网

Dev for Dev 视频技术 色彩增强

全球首个开源车路协同数据集发布,促进学界业界跨界融合

百度开发者中心

| 从DevOps到BizDevOps, 研发效能提升的系统方法

阿里云云效

云计算 阿里云 DevOps 云原生 研发

Python代码阅读(第76篇):摄氏温度与华氏温度互转

Felix

Python 编程 阅读代码 Python初学者

建木持续集成平台v2.2.3发布

Jianmu

DevOps CI/CD 开源项目

异步请求积压可视化|如何 1 分钟内快速定位函数计算积压问题

阿里巴巴云原生

阿里云 Serverless 云原生 函数计算 FC

【网络安全】Agent内存马的自动分析与查杀

H

网络安全 WEB安全

面试官:linux零拷贝的原理是什么?

CRMEB

阿里云资深专家李国强:云原生的一些趋势和新方向

阿里巴巴云原生

阿里云 容器 微服务 云原生 趋势

要做需求管理?看这篇就够了。

石云升

产品经理 需求管理 需求分析 2月月更

如何防止Arp攻击

喀拉峻

网络安全

如何高效交付专有云?百度智能云有妙招

百度开发者中心

存储高性能、传输如闪电,焱融科技携手瑞云科技给你带来不一样的体验

焱融科技

云计算 分布式 云原生 高性能 文件存储

安全开采数据“富矿”:隐私计算基建的融合与进击

脑极体

系统学习 TypeScript(四)——变量声明的初步学习

编程三昧

typescript 前端 2月月更

这么写简历,offer拿到手软,从业5年的软件测试工程师手把手教你写出满分简历

程序员暴龙

软件测试 简历优化 简历 就业 软件测试工程师

2023 IDEA大会开幕,共探AI新篇章下的技术创新与创业_生成式 AI_蔡芳芳_InfoQ精选文章