AI&大模型

关注
收录了AI&大模型频道下的 14322 篇内容
关注 AIGC,跟踪科技公司、科研机构和IT产业在人工智能方向的最新动态,挖掘人工智能技术应用场景和商业化落地案例,重点关注该技术在金融、教育、医疗、交通、智慧城市等方向的应用。
  • 全部
  • 自动驾驶
  • 计算机视觉
  • 生成式 AI
  • AI 工程化
  • 机器学习/深度学习
  • 自然语言处理
  • 芯片&算力
  • 其他
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
节前DeepSeek又突击了!大方开源V3.2实验版,API 价格降低 50%+
节前 DeepSeek 又突击了!大方开源 V3.2 实验版,API 价格降低 50%+

作为迈向下一代架构的过渡,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek 稀疏注意力机制(DSA)——一种稀疏注意力机制,旨在探索和验证在长上下文场景下训练和推理效率的优化。

这家“小众”赛道的无人驾驶公司,刚刚融了两亿
这家“小众”赛道的无人驾驶公司,刚刚融了两亿

刚刚,踏歌智行宣布完成 C+ 轮融资,总交易金额超 2 亿元。

徐峥首次AI智驾城市实景真人秀!千里科技端到端模型闯过重庆“8D”考验,18 个月要打通 Robotaxi 全链路
徐峥首次 AI 智驾城市实景真人秀!千里科技端到端模型闯过重庆“8D”考验,18 个月要打通 Robotaxi 全链路

根据计划,千里科技将在全球 10 座城市实现规模化的 Robotaxi 运营服务,在单一城市部署超过 1000 辆 Robotaxi。

云栖大会丨奇富科技费浩峻深度解构金融大模型四步破局路径
云栖大会丨奇富科技费浩峻深度解构金融大模型四步破局路径

告别参数规模的盲目追逐,“做小做强”

小众语言再难出头!写代码靠和 AI 聊天、连用啥都不在乎了,开发者感叹:等我们不在了,AI 智能体会接手
小众语言再难出头!写代码靠和 AI 聊天、连用啥都不在乎了,开发者感叹:等我们不在了,AI 智能体会接手

自 2013 年以来,IEEE Spectrum 一直坚持不懈地整理和编纂程序员们最喜爱的年度编程语言排名。近日,IEEE Spectrum 对当前编程语言的流行度进行了 2025 年的排名,但这其中似乎暴露了不少问题。

学生开发者经验|豆包大模型 + TRAE,让 AI 应用快速落地
学生开发者经验|豆包大模型 + TRAE,让 AI 应用快速落地

因为自己是 INFJ,常常喜欢规划做事情,但是有时候遇见一个事情,却不知道如何开始。所以就想做一个工具,让现在特别火的 AI 大模型帮助我把复杂的事情简单化,实现一个事情分成好几个小步骤一步一步完成!

金融行业用好大模型,只有“垂直”一个解
金融行业用好大模型,只有“垂直”一个解

当大模型以应用落地论英雄时,谁在裸泳显而易见。尤其在复杂业务场景下,面对千丝万缕的业务逻辑,模型能不能用和好不好用之间的界线愈发明显。金融行业作为复杂业务场景的代表,自然成了大模型们的“照妖镜”。观察那些用得好的金融大模型不难发现,它们都有一个共同点,那就是都是垂直模型。

所有知识型岗都要被AI “吞了!清华大学教授刘嘉:未来大学分化猛烈,软件公司靠 “几人 + Agent” 就够
所有知识型岗都要被 AI “吞了!清华大学教授刘嘉:未来大学分化猛烈,软件公司靠 “几人 + Agent” 就够

从认知底层逻辑讲起,一步步帮助读者清晰认知 AI、审视自身定位,堪称是一则给所有人的“AI 时代生存指南”。

无问芯穹总经理曾书霖博士已确认出席QCon 上海站,分享AI 2.0 时代的大模型推理:从模型到硬件的协同优化
无问芯穹总经理曾书霖博士已确认出席 QCon 上海站,分享 AI 2.0 时代的大模型推理:从模型到硬件的协同优化

分享软硬件协同优化以提升智能系统能效的研究成果:模型稀疏量化压缩、高效推理系统设计与大模型加速器设计。

AI算力提升的最大阻碍,竟源自数十年前的架构决策?
AI 算力提升的最大阻碍,竟源自数十年前的架构决策?

大多数计算机遵循的冯·诺依曼架构,强调将计算与内存彼此分离。这样的架构虽然完美适应传统计算需求,但在 AI 计算时代却造成严重的数据拥堵。

谷歌推出实验性私有模型 VaultGemma:主打差分隐私技术
谷歌推出实验性私有模型 VaultGemma:主打差分隐私技术

VaultGemma 是一款拥有十亿参数、基于 Gemma 2 架构的大语言模型。谷歌从头开始训练该模型时,就采用了差分隐私技术,是为防止模型记住并在后续泄露训练数据内容。虽然该模型目前仍属研究性质,但 VaultGemma 未来有望在医疗、金融、法律等受严格监管的领域找到用武之地。

OpenAI 发布 GPT-5-Codex:专注复杂代码重构与代码评审优化
OpenAI 发布 GPT-5-Codex:专注复杂代码重构与代码评审优化

OpenAI 正式推出 GPT-5-Codex,这是专为处理复杂软件工程任务而优化的 GPT-5 特别版,尤其擅长大规模代码重构和长时间的代码审查工作流。

50 万奖金池,学生党狂喜!2025 深圳国际金融科技大赛启动报名啦!
50 万奖金池,学生党狂喜!2025 深圳国际金融科技大赛启动报名啦!

2025 深圳国际金融科技大赛全面启动!火热招募中

从“氛围编程”到“效能编程”,来自一线研发团队的企业最佳实践
从“氛围编程”到“效能编程”,来自一线研发团队的企业最佳实践

一款真正能在企业内落地且提效,不仅满足老板的期望,也能让专业开发者尽情 Vibe 的 Coding 工具应该具备哪些特征?

4 人起步,Next.js 之父带队冲出Agent爆款:开发者用户一年超过去十年,一秒生成 7 个应用!
4 人起步,Next.js 之父带队冲出 Agent 爆款:开发者用户一年超过去十年,一秒生成 7 个应用!

“提前进入新领域,往往能获得更多机会。不要过于在意外界眼中的“高地位”技术,而是要专注于潜力所在。”

2025人工智能计算大会:超节点智算应用“北京方案”发布,智能体时代的算力底座正在成型
2025 人工智能计算大会:超节点智算应用“北京方案”发布,智能体时代的算力底座正在成型

2025 人工智能计算大会(AICC2025)在北京召开,发布《智算应用“北京方案”》,联合 30 余家机构推动基于国产超节点的“行业智能体”落地。大会聚焦算力升级、开源生态与智能体产业化,推出 FlagOS 1.5、算力补贴政策等多项成果,涵盖 AI for Science、低空经济、智能驾驶等前沿议题,展现我国人工智能向高效、开放、自主发展的新态势。

华为算力“公共事业”:“超节点+全栈开源”如何撬动AI未来?
华为算力“公共事业”:“超节点 + 全栈开源”如何撬动 AI 未来?

人工智能之父约翰·麦卡锡曾说:“有一天,计算可能会被组织成一个公共事业,就像电话系统是一个公共事业一样。”如今,他的这一预判已经成为现实,而在计算背后,不可或缺的算力也正在成为各大科技厂商竞相争夺的战略要地。

2025 京东全球科技探索者大会:京东健康发布“AI 医院”、升级“京医千询 2.0”
2025 京东全球科技探索者大会:京东健康发布“AI 医院”、升级“京医千询 2.0”

9 月 25 日,2025 京东全球科技探索者大会“AI 健康论坛”在京举行。京东健康旗下京医千询医疗大模型 2.0 版本再次全新升级,并推出全新的“AI 医院 1.0”,在业内首创的 AI 驱动“医检诊药”闭环。

用 AI 重塑电商,京东零售发布电商创新 AI 架构体系 Oxygen
用 AI 重塑电商,京东零售发布电商创新 AI 架构体系 Oxygen

9 月 25 日,2025 京东全球科技探索者大会召开。会上,京东集团高级副总裁、京东集团产品委员会主席胡喜首次对外公布电商创新 AI 架构体系 Oxygen。

具身智能落地物流行业的最大难题,被京东物流撕开一道裂缝
具身智能落地物流行业的最大难题,被京东物流撕开一道裂缝

9 月 25 日,在 JDD 2025 京东全球科技探索者大会上,京东物流正式发布“超脑 2.0”与“异狼”系列新品。通过“超脑 + 狼族”的软硬一体化协同,京东物流的智能体系正从“模块化智能”迈入“一体化智能”新阶段。

AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海
AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海

系统介绍如何通过“全文重写”方案实现 NES 能力,并突破高性能推理、训练数据构建与模型优化等关键技术难题。

飞桨分布式技术揭秘:如何高效训练文心 4.5 大模型|QCon 上海
飞桨分布式技术揭秘:如何高效训练文心 4.5 大模型|QCon 上海

揭秘飞桨在大模型训练中的性能优化实践,涵盖多模异构 MoE 结构下的工程挑战与系统性解决方案。

AI付费元年?从抓取到授权,微软PCM或定义下一代内容交易模式
AI 付费元年?从抓取到授权,微软 PCM 或定义下一代内容交易模式

PCM)。在这一模式下,当出版商的内容被其 AI 产品(首批是 Copilot 助手)使用时,将获得持续付费补偿。

刚刚,国产GPU厂摩尔线程成功过会
刚刚,国产 GPU 厂摩尔线程成功过会

“国产英伟达”真的要来了?

从模型为王到应用为王:AI 中间件的基建之战 |InfoQ《极客有约》
从模型为王到应用为王:AI 中间件的基建之战 |InfoQ《极客有约》

模型触手可得,落地举步维艰?真正的竞争,是 AI 应用的“落地效率”。一场关于 AI 中间件的“基建之战”正在开启。

吴晓波探展模力工场:开发者从技术到商业化的关键一跃
吴晓波探展模力工场:开发者从技术到商业化的关键一跃

AI 的下半场已经开始,竞争的焦点从技术突破转向应用落地。

阶跃星辰语音模型负责人杨学锐确认出席QCon上海,分享从语音表征到模型架构的端到端语音模型实践
阶跃星辰语音模型负责人杨学锐确认出席 QCon 上海,分享从语音表征到模型架构的端到端语音模型实践

直面实践中诸如数据差异、推理效率、模态对齐等核心挑战,分享落地经验。

字节跳动多媒体实验室联合 ISCAS 举办第五届神经网络视频编码竞赛
字节跳动多媒体实验室联合 ISCAS 举办第五届神经网络视频编码竞赛

ISCAS 2026 将继续携手字节跳动多媒体实验室,举办第五届神经网络视频编码竞赛。本届竞赛设立了三个最佳性能奖和一个最佳创意奖,每个奖项的奖金为 4500 美元。

XTransfer发布自研外贸金融大模型TradePilot 2.0,技术架构全面升级
XTransfer 发布自研外贸金融大模型 TradePilot 2.0,技术架构全面升级

时隔一年,XTransfer 正式推出 TradePilot 2.0 版本。

曙光网络发布新一代工业边缘 AI 计算平台:以智控一体解锁工业大模型边缘落地
曙光网络发布新一代工业边缘 AI 计算平台:以智控一体解锁工业大模型边缘落地

近日,在中国国际工业博览会现场,曙光网络重磅发布新一代国产工业边缘 AI 计算平台。这一创新产品的亮相,标志着我国工业 AI 正式迈入从“感知智能”到“生成式与认知智能”并最终实现“智控一体”的重大范式跃迁阶段,为企业智能制造转型升级注入了核心动力。

  • 用户头像
    关注

    InfoQ高级编辑

  • 用户头像
    关注

    暂无签名

  • 用户头像
    关注

    暂无签名

    OpenSearch RAG 应用实践
    OpenSearch RAG 应用实践

    邢少敏 | 阿里巴巴 OpenSearch 研发负责人

    立即下载
    大型活动中,Web 场景动效的那些事儿

    俞天翔 | 快手 增长研发大型活动/激励前端负责人

    立即下载
    基于 Elasticsearch 创建企业 AI 搜索应用实践

    刘晓国 | Elastic 中国社区首席布道师

    立即下载