写点什么

深思考人工智能 CEO 兼 AI 算法科学家杨志明将在 AICon 北京分享端侧多模态大模型的创新实践

  • 2025-06-05
    北京
  • 本文字数:2099 字

    阅读完需:约 7 分钟

大小:1.14M时长:06:37
深思考人工智能CEO 兼 AI 算法科学家杨志明将在AICon北京分享端侧多模态大模型的创新实践

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


深思考人工智能 CEO 兼 AI 算法科学家杨志明已确认出席并发表题为《深思考端侧多模态大模型TinyDongni&Deepseek的创新实践》的主题分享。当前,全球 AI 大模型发展进入关键阶段,端侧 AI 市场展现出巨大潜力,预计到 2032 年全球规模将达到 1436 亿美元,覆盖医疗、智能终端、机器人等多个重要领域。深思考人工智能推出的 TinyDongni&DeepSeek 端侧多模态大模型,通过创新的 1.5B/4B 双参数架构设计,在保障性能的同时实现高效本地化部署。该方案采用自研 Dongni-AMDC 量化压缩技术,将模型优化为 1B 端侧版本,并赋予视觉模态能力,全面适配鸿蒙、Linux、Windows 等操作系统及国产算力平台。其核心技术优势包括:Token 压缩与多精度混合量化使 1.5B 模型在骁龙 8Gen3 上达到 20-25 token/s 的解码速度;跨模态性能在多项测试中保持领先,0.4B 版本图像检索计算量仅 175BFLOPs。目前已在智能手机、人形机器人、AI 摄像头、AIPC Suite、医学显微镜及存储设备等场景成功落地,为各领域提供安全可靠的端侧 AI 解决方案。



杨志明现任深思考人工智能机器人科技(北京)有限公司 CEO 兼 AI 算法科学家。毕业于中国科学院研究生院,获硕士学位,后在中国科学院软件研究所攻读博士,专注于自然语言处理、深度学习和机器学习。同时拥有中国科学院大学 MBA 和清华五道口金融学院的学术背景。


是苏州领军人才和江苏双创人才,担任中国银行业协会 CFT 人工智能课程讲席教授,上海金浦资本 2019 年人工智能特聘专家,宁波大学科技学院客座教授。拥有 20 年大型复杂系统与 AI 系统架构设计与研发经验,曾主持多项重大核心系统研发,参与多项国家级重大项目研究。


拥有知识产权 113 项,其中国家发明专利 32 项,发表多篇一级学术期刊论文,荣获国际国内奖项 19 项。作为首席架构师与核心算法设计师,带领团队蝉联多届人机对话及语言与智能技术大赛冠军,入选工信部 2021“新一代人工智能产业创新发展重点任务揭榜优胜单位”。他在本次会议的详细演讲内容如下:


演讲提纲

端侧大模型是指在设备本地(如智能手机、个人电脑、IoT 设备、嵌入式系统等)运行的大模型,其特点是参数规模不大,不需要网络传输,响应速度快,且可以保障用户数据的安全性。本次分享主要介绍深思考“TinyDongni”&“DeepSeek”超小端侧多模态大模型,围绕背景与市场需求,核心工作、差异化技术优势、赋能应用展开。


1. 背景与市场需求

  • 随着个人和企业本地非结构化数据(如图片、视频、文档)以年均 58%的速度激增,传统基于文件名或关键词的检索方式已显乏力——无法理解图像内容、视频语义或文档逻辑,导致搜索失败率超 60%。专业用户日均因此损失 47 分钟,亟需支持跨格式语义分析、可离线运行的端侧 AI 搜索方案,以充分挖掘数据资产价值

2. 核心工作

  • 使用深思考自研的 Dongni-AMDC(Adaptive Multi-Dimensional Compression) 方法量化压缩了 DeepSeek R1 模型为 DeepSeek R1 -1B 端侧模型。

  • 使得 DeepSeek R1-1B “长眼睛”具备视觉模态能力,从而增强为多模态模型。

  • 适配了开源鸿蒙操作系统(据悉也同时适配了 Linux Ubuntu 22.04 / 统信 UOS/Windows 10 & 11/Android 14)

  • 将 TinyDongni”及“deepseek”超小端侧多模态大模型优化运行至国产算力模组,推出一站式解决方案。

3. 差异化技术优势

  • 创新的端侧模型量化及加速推理的技术:Token 数量压缩、模型量化、编译优化、多芯片协同处理、NPU 加速、内存使用优化、定制调优。

  • 跨模态端侧模型的性能优势

  • 适配多种芯片

4. 赋能应用

  • 对 AI PC 的赋能

  • 对 AI 手机的赋能

  • 对 AI 摄像头的赋能

  • 对医学显微镜的赋能


您认为,这样的技术在实践过程中有哪些痛点?

  • 算力与效能的极限博弈:1B 参数模型在低功耗 NPU 上运行仍面临发热降频问题

  • 多模态对齐的精度损失:跨模态向量空间映射误差导致语义漂移


您的演讲有哪些前沿亮点?

  • 解锁端侧 AI 技术落地的实战方法论

  • 了解如何将十亿级大模型压缩到端侧可运行规模;掌握多模态对齐、内存优化等关键技术的工程化实现路径,避免重复踩坑。

  • 突破现有业务瓶颈的创新视角

  • 学习在国产芯片上实现 3.2 倍推理加速的优化策略;启发将传统检索系统升级为语义中枢的路径。

  • 预判技术演进趋势的决策依据

  • 提前布局技术储备;抓住开放插件生态的早期接入窗口,建立技术护城河。


听众收益

  • 了解大模型在隐私敏感场景(如医疗、金融)的端侧部署实践

  • 获取多模态搜索、实时决策、可控输出等技术的行业适配方法论

  • 洞察 AI 与鸿蒙生态、边缘计算的融合趋势


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-05 17:006458

评论

发布
暂无评论

漏洞披露的罗生门:安全行业的复杂博弈

qife

漏洞披露 零日漏洞

最佳LED视频墙分辨率推荐

Dylan

LED显示屏 户外LED显示屏 led显示屏厂家 户内led显示屏 算力租赁

如何一眼定位SQL的代码来源:一款SQL染色标记的简易MyBatis插件

京东科技开发者

亚马逊AI编程软件Kiro:产品经理赶紧抱紧饭碗!

阿星AI工作室

产品 编程 AI 亚马逊 kiro

告别 T+1!解密金融级实时数据平台的构建与实践

镜舟科技

数据分析 StarRocks 物化视图 主键模型 湖仓架构

低代码可视化工作流的系统设计与实现路径研究

JeeLowCode低代码平台

工作流 低代码 可视化 工作流编排 低代码选择

Flink exactly once sink 实现

Joseph295

雪豹大模型驱动效率革命 华鼎冷链科技重构餐饮供应链神经网络

科技汇

大数据-45 Redis 从快照到日志:RDB 与 AOF 持久化机制

武子康

Java redis 大数据 缓存 分布式

开启你的专属智能时代:枫清科技个人智能体限时体验计划上线!

Fabarta

人工智能 智能体 agent

完美黑客配置的秘诀?Docker化渗透测试工具集ReconBox详解

qife

网络安全 渗透测试

当使用__PSLockDownPolicy时绕过PowerShell约束语言模式的技术分析

qife

PowerShell 安全绕过

高性能数据模型设计

俞凡

大数据

AI通话的N种新玩法,让科幻照进现实

脑极体

AI

鸿蒙NEXT时代你所不知道的全平台跨端框架:CMP、Kuikly、Lynx、uni-app x等

JackJiang

鸿蒙 网络编程 即时通讯 IM

使用Svelte和D3实现交互式数据可视化

qife

数据可视化 Svelte

终结数据孤岛!百度智能云亮相TDBC大会:重塑数据与AI的连接方式

科技热闻

MCP协议中的不安全凭证存储漏洞分析与安全实践

qife

MCP 凭证安全

活动回顾丨主动式语音 AI:全双工加持,让 AI 既会抢答也懂适时沉默|RTE Meetup

声网

淘宝商品详情API响应数据解析(一)

tbapi

淘宝商品详情接口 淘宝API 天猫商品详情接口 天猫API

通过响应篡改绕过OTP验证——移动端渗透测试实战

qife

移动安全 OTP绕过

ZKTorch:通过并行证明累积将机器学习推理编译为零知识证明

qife

零知识证明 密码学

AI虫子种类识别数据集(近3000张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】

申公豹

数据集 yolo

n8n教程分享,从Github读取.md文档内容

溪抱鱼

人工智能 n8n

一篇说人话的文章,告诉你 Django、Flask、FastAPI 到底怎么选

程序员晚枫

django flask FastApi

手慢无!最高130元云手机代金券,限时限量,先到先得!

kookeey代理严选

代理IP 云手机 海外网络加速 全球直播网络 批量注册

springboot项目集成大数据第三方dolphinscheduler调度器

刘大猫

人工智能 算法 DolphinScheduler 调度器 大模型

淘宝商品评论API接口详解

tbapi

淘宝商品评论接口 天猫商品评论接口 淘宝评论API 天猫评论API 淘宝评论采集

领先OpenAI三个月,百度文库GenFlow领跑通用Agent领域,2.0版本8月上线

科技热闻

揭秘Chrome DevTools:从原理到自定义调试工具

京东科技开发者

Spring 拦截器:你的请求休想逃过我的五指山!

京东科技开发者

深思考人工智能CEO 兼 AI 算法科学家杨志明将在AICon北京分享端侧多模态大模型的创新实践_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章