AI&大模型

关注
收录了AI&大模型频道下的 15113 篇内容
关注 AIGC,跟踪科技公司、科研机构和IT产业在人工智能方向的最新动态,挖掘人工智能技术应用场景和商业化落地案例,重点关注该技术在金融、教育、医疗、交通、智慧城市等方向的应用。
  • 全部
  • 自动驾驶
  • 计算机视觉
  • 生成式 AI
  • AI 工程化
  • 机器学习/深度学习
  • 自然语言处理
  • 具身智能
  • 芯片&算力
  • 其他
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
Mistral发布OCR 3,提升了手写及结构化文档识别的准确率
Mistral 发布 OCR 3,提升了手写及结构化文档识别的准确率

Mistral 近日发布了其光学字符识别(optical character recognition,OCR)模型的最新版本,Mistral OCR 3,该版本专注于在多种文档类型上实现更高的精度,包括手写笔记、表单、低质量扫描件以及结构复杂的表格。

2026 年预测:智能体将推动集中化战略,带来新的工作方式 | 技术趋势
2026 年预测:智能体将推动集中化战略,带来新的工作方式 | 技术趋势

的投资回报远超预期?41%!在企业中实现真正落地的关键之年。 将迎来爆发式增长与颠覆性普及。尽管技术进步显著且持续加速,但这一年的更深层意义在于,它重塑了我们对技术可行性的理解。

Agent 不是渐进升级,而是要“换代”了:Cursor 工程负责人放话未来三到六个月,行业将迎来大变局
Agent 不是渐进升级,而是要“换代”了:Cursor 工程负责人放话未来三到六个月,行业将迎来大变局

过去一年,编码 Agent 的变化速度,已经快到让人很难用“功能升级”来形容。

最烦做演讲!黄仁勋曝英伟达养了61个CEO、从不炒犯错员工:CEO是最脆弱群体
最烦做演讲!黄仁勋曝英伟达养了 61 个 CEO、从不炒犯错员工:CEO 是最脆弱群体

“世界上不会再出现第二个我这样的 CEO 了。”近日,英伟达联合创始人兼首席执行官黄仁勋(Jensen Huang)在一场私人访谈中这样说道。

二十年,重新出发!第 20 届 D2 技术大会「AI 新」议题全球征集正式开启
二十年,重新出发!第 20 届 D2 技术大会「AI 新」议题全球征集正式开启

来 D2,分享你对 AI 时代终端技术的独到见解,共同定义下一个二十年的生产力!

Cursor推出动态上下文发现功能,提升了Token的使用效率
Cursor 推出动态上下文发现功能,提升了 Token 的使用效率

Cursor 推出了一种新方法,用于减少发送给大语言模型(LLM)的请求上下文的大小。这种方法名为动态上下文发现(Dynamic Context Discovery),它摒弃了以往在请求开始时就包含大量静态上下文的做法,转而让智能体(agent)按需动态检索所需信息。这种方式不仅显著减少了 token 消耗,也避免了将可能令人困惑或无关的细节混入上下文。

Agoda是如何将多个数据管道统一为单一事实来源的
Agoda 是如何将多个数据管道统一为单一事实来源的

Agoda 近日分享了他们如何将多个独立的数据管道整合为一个基于 Apache Spark 的集中式平台,以消除财务数据中的不一致性。该公司构建了一个多层质量保障框架,结合自动化校验、基于机器学习的异常检测以及与上游团队签订的数据契约(data contracts),确保用于财务报表和战略规划的财务指标准确无误,同时每天处理数百万笔预订交易。

阿里云 CIO 全面深度解析:企业 AI 大模型落地实践「 RIDE 方法论」
阿里云 CIO 全面深度解析:企业 AI 大模型落地实践「 RIDE 方法论」

本文整理自阿里云智能集团副总裁、 CIO 蒋林泉在 AICon 2025 年 8 月所分享的 “阿里云大模型应用落地实践之路”,并完整呈现他对企业 AI 落地的经典方法论“RIDE”和数字人案例。

谷歌发布适用于多智能体的八种设计模式
谷歌发布适用于多智能体的八种设计模式

谷歌近期发布了一份指南,详细介绍了多智能体系统(Multi-Agent Systems, MAS)的八种核心设计模式,涵盖从顺序流水线到人工介入(human-in-the-loop)架构等多种范式。该指南不仅对每种模式都提供了清晰的解释,还附带了使用谷歌 Agent Development Kit(ADK)实现的示例代码。

ChatGPT 将测试广告投放,AI 信任危机一触即发
ChatGPT 将测试广告投放,AI 信任危机一触即发

OpenAI 宣布在免费版及新推出的 Go 版本中引入广告机制,社交媒体反应两极分化,用户信任与商业变现的平衡难题浮出水面。

Vibe Coding新范式催生万亿市场,零克云平台破解技术落地难题
Vibe Coding 新范式催生万亿市场,零克云平台破解技术落地难题

Vibe Coding 如何撬动万亿市场?

烧掉数万亿 Token、数百 Agent 连跑一周:Cursor“从零写浏览器”,结果是拼装人类代码?
烧掉数万亿 Token、数百 Agent 连跑一周:Cursor“从零写浏览器”,结果是拼装人类代码?

这更像是一场营销活动,而不是一次真正的 agentic 实验。

告别“刀片利润”,AI如何帮中国数百万中小工厂构筑新护城河?
告别“刀片利润”,AI 如何帮中国数百万中小工厂构筑新护城河?

中国数百万中小工厂主的共同困境:规模在增长,利润在萎缩;订单在增加,确定性在流失。

IDE消亡之年?Steve Yegge 两句狠话:2026 年还用 IDE 就不行,每天烧 500–1000 美元 Token 才合理
IDE 消亡之年?Steve Yegge 两句狠话:2026 年还用 IDE 就不行,每天烧 500–1000 美元 Token 才合理

2026 年的开发工具会是什么样?Steve Yegge:答案不是 Claude Code

腾讯云ADP国内首发AI原生Widget:一句话秒级生成交互组件,重塑Agent使用体验
腾讯云 ADP 国内首发 AI 原生 Widget:一句话秒级生成交互组件,重塑 Agent 使用体验

智能体对话正在告别“纯文本时代”!

AI 的下一个十年:从技术拐点到工程落地的路线图
AI 的下一个十年:从技术拐点到工程落地的路线图

Snowflake 首席执行官 Sridhar Ramaswamy、LandingAI 执行董事长、DeepLearning.AI 创始人吴恩达(Andrew Ng),以及亚马逊云科技 Agentic AI 副总裁 Swami Sivasubramanian 在 BUILD 2025 上的对谈。

受够了Copilot的“霸王条款”?GitHub全球宕机遭怒骂,引爆开发者“大逃离”!
受够了 Copilot 的“霸王条款”?GitHub 全球宕机遭怒骂,引爆开发者“大逃离”!

几个小时前,有大批开发者反馈:GitHub 大面积宕机了,社交平台上充斥着“粉色独角兽”的截图和相应的控诉。

拒绝传统Router“瞎指挥”,多智能体如何实现智能任务分配?
拒绝传统 Router“瞎指挥”,多智能体如何实现智能任务分配?

过去一年里,Multi-Agent 架构正在成为企业 AI 的新基建。

OpenAI前团队创业内乱,CTO泄密竞对遭开除!翁荔火速发文
OpenAI 前团队创业内乱,CTO 泄密竞对遭开除!翁荔火速发文

体系外最值得关注的实验之一”。亿美元种子轮融资的明星公司,如今正迎来成立以来最关键的一次人员震荡。 Zoph 的离职。

谷歌发布 Gemma Scope 2,深化对 LLM 行为的理解
谷歌发布 Gemma Scope 2,深化对 LLM 行为的理解

Gemma Scope 2 是一套旨在解释 Gemini 3 模型行为的工具,使研究人员能够分析模型的突发行为,审核和调试 AI 代理,并针对越狱、幻觉和阿谀奉承等安全问题制定缓解策略。

FACTS基准测试套件问世,用于评估大型语言模型的事实准确性
FACTS 基准测试套件问世,用于评估大型语言模型的事实准确性

FACTS 基准测试套件发布,这是一个旨在系统性评估大型语言模型事实准确性的全新行业基准。

全靠Claude Code 10天赶工上线,Cowork 删用户11G文件不含糊!核心研发:长时间打磨再发布很难成功
全靠 Claude Code 10 天赶工上线,Cowork 删用户 11G 文件不含糊!核心研发:长时间打磨再发布很难成功

“要求普通、非程序员用户去警惕‘可能表明提示注入的可疑行为’,这是不公平的!”

刚刚,阿里园区被奶茶包围,都是千问点的!西溪叫不动外卖
刚刚,阿里园区被奶茶包围,都是千问点的!西溪叫不动外卖

2026 年,AI 真正“下地干活”的第一战,被阿里打响了。杯“伯牙绝弦”奶茶。整个过程没有人工介入。

“商业版 HTTP”来了:谷歌 CEO 劈柴官宣 UCP,Agent 直接下单,倒逼淘宝京东“拆家式重构”?
“商业版 HTTP”来了:谷歌 CEO 劈柴官宣 UCP,Agent 直接下单,倒逼淘宝京东“拆家式重构”?

“品牌不再争夺用户注意力,他们将竞相争取被 Agent 选中。网站变得可有可无。这就是非人类商业的开端。”

从数据存储到 AI 基建,XSKY 发布全栈AI数据方案破解算力效率难题
从数据存储到 AI 基建,XSKY 发布全栈 AI 数据方案破解算力效率难题

2026 年 1 月 15 日,XSKY 星辰天合在北京举办主题为“数据常青 智算无界”的 AIMesh 产品战略发布会,宣告公司战略重心从“信息技术(IT)”全面跨越至“数据智能(Data Intelligence)”。

谷歌推出Conductor:一款面向Gemini CLI的上下文驱动开发扩展
谷歌推出 Conductor:一款面向 Gemini CLI 的上下文驱动开发扩展

谷歌发布了新的 Gemini CLI 预览扩展 Conductor,为 AI 辅助软件开发引入了结构化、上下文驱动的方法。该扩展旨在解决基于聊天的编码工具的一个常见限制:跨会话丢失项目上下文。

手握30亿、被蚂蚁狂挖人,转型被骂惨的王小川,真的翻身了?
手握 30 亿、被蚂蚁狂挖人,转型被骂惨的王小川,真的翻身了?

“阿福跟我们的路线不一样”

LangGrant推出LEDGE MCP服务器,赋能企业数据库启用代理式AI
LangGrant 推出 LEDGE MCP 服务器,赋能企业数据库启用代理式 AI

LangGrant 推出了 LEDGE MCP 服务器,这是一个新的企业平台,旨在让大语言模型在复杂的数据库环境中进行推理,而无需直接访问或暴露底层数据。该版本旨在消除组织在将代理式 AI 应用于受受控生产数据时面临的一些最大障碍,即安全限制、失控的 token 成本和不可靠的分析结果。

  • 用户头像
    关注

    InfoQ高级编辑

  • 用户头像
    关注

    InfoQ编辑(V: TracyZ1024)

  • 用户头像
    关注

    InfoQ策划编辑

    LAS Daft 多模态数据引擎的架构与应用
    LAS Daft 多模态数据引擎的架构与应用

    琚克俭 | 火山引擎 AI 数据湖服务 架构师

    立即下载
    生成式 AI 驱动的软件开发生产力变革

    王晓野 | 亚马逊云科技 大中华区产品技术总监

    立即下载
    Next-Generation Software Development: Challenges, Best Practices, and Future Trends

    Jeff Barr | Amazon Web Services Vice President & Chief Evangelist

    立即下载