AI&大模型

关注
收录了AI&大模型频道下的 14731 篇内容
关注 AIGC,跟踪科技公司、科研机构和IT产业在人工智能方向的最新动态,挖掘人工智能技术应用场景和商业化落地案例,重点关注该技术在金融、教育、医疗、交通、智慧城市等方向的应用。
  • 全部
  • 自动驾驶
  • 计算机视觉
  • 生成式 AI
  • AI 工程化
  • 机器学习/深度学习
  • 自然语言处理
  • 芯片&算力
  • 其他
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
规范驱动开发:瀑布模型回潮
规范驱动开发:瀑布模型回潮

敏捷方法早已淘汰了规范。我们真的需要让它死而复生吗?

抛弃“级联”架构!快手OneRec用大模型重构推荐系统,服务成本降至1/10
抛弃“级联”架构!快手 OneRec 用大模型重构推荐系统,服务成本降至 1/10

快手科技副总裁、基础大模型及推荐模型负责人周国睿系统解析了推荐系统的范式革新、 OneRecV2 的 scaling 定制优化,以及 OneRec-Think 的“生成—理解”统一进展,为 AI 原生时代的推荐提供可复制的方法论。

用AI“打开”金融市场黑盒:微软亚洲研究院如何构建订单级仿真引擎
用 AI“打开”金融市场黑盒:微软亚洲研究院如何构建订单级仿真引擎

InfoQ 荣幸邀请到了微软亚洲研究院机器学习组首席研究员刘炜清在 AICon 全球人工智能开发与应用大会上分享《MarS:由生成式基础模型驱动的金融市场仿真引擎》,他分享了团队在“AI for Finance”上的探索:通过构建基于订单级原生数据的金融基座模型与可自动迭代的 Agent 流程,实现了高保真市场模拟与高效决策优化。

Olmo 3 发布:模型开发与训练全程透明开放
Olmo 3 发布:模型开发与训练全程透明开放

艾伦人工智能研究所发布开源语言模型系列 Olmo 3,向研究人员与开发者完整开放模型全生命周期。

xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态
xLLM 社区重磅首秀,揭秘大模型推理全景图与开源 AI Infra 生态

过去,AI Infra 基础设施的核心技术长期依赖国外开源框架(如 vLLM、SGLang、TensorRT-LLM 等)。随着 xLLM 等推理引擎的开源,将大大加速国产全栈 AI Infra 生态建设。

工作场景AI化,一个月花100美元订阅AI工具值吗?
工作场景 AI 化,一个月花 100 美元订阅 AI 工具值吗?

新的 AI 时代,组织形态应从“固态”向“液态”转型。

阿里千问进入电脑桌面,与夸克AI浏览器深度融合
阿里千问进入电脑桌面,与夸克 AI 浏览器深度融合

千问正在升级为阿里 C 端产品的核心 AI 引擎

开发者怒扒200家AI公司,73%“套壳”拿融资、服务溢价甚至高达千倍!创始人直接认了:大家都在撒谎
开发者怒扒 200 家 AI 公司,73%“套壳”拿融资、服务溢价甚至高达千倍!创始人直接认了:大家都在撒谎

200 家公司被曝仅 18 家真创新、38 家代码相似度超 90%,创始人只想“忽悠”到底?

谷歌推出Code Wiki:一个基于AI的持续交互式代码文档系统
谷歌推出 Code Wiki:一个基于 AI 的持续交互式代码文档系统

谷歌推出了一个新平台 Code Wiki,旨在使软件文档与其所描述的代码始终保持同步。该系统为每个代码库生成一个结构化的维基——每次更改代码后会自动更新,并提供一个能够理解整个代码库的集成聊天界面。目前,面向开源项目的公开预览版旨在消除软件开发中最昂贵的其中一个瓶颈:阅读和理解现有代码。

KubeCon NA 2025:探讨生成式AI时代的工具
KubeCon NA 2025:探讨生成式 AI 时代的工具

生成式人工智能技术需要支持新的工作负载、流量模式和基础设施需求,并需要一套新的工具来应对 GenAI 时代。来自 Tetrate 的 Erica Hughberg 和来自彭博社的 Alexa Griffith 在 2025 年北美 KubeCon + CloudNativeCon 会议上讨论了构建大规模提供模型推理服务的 GenAI 平台所需的条件。

构建你的第一个 Snowflake 智能体:从概念到原型只需 3 步! | 技术实践
构建你的第一个 Snowflake 智能体:从概念到原型只需 3 步! | 技术实践

我们将基于 Snowflake 平台构建一个 AI 智能体,手把手带你创建一个医疗健康智能体,该智能体能够通过查询数据库提供与临床试验相关问题的答案。

在日常工作流程中将数据转化为智能 | 技术趋势
在日常工作流程中将数据转化为智能 | 技术趋势

对于所有企业用户而言,Snowflake Cortex Agents 让“AI 驱动的数据交互”变得简单。用户只需在 Microsoft 365 Copilot 或 Microsoft Teams 里使用日常语言,就能对 Snowflake 中的数据进行搜索、分析并生成洞见。

携手共进,共赴“星河”-2025年“星河产业应用创新奖”火热申报中!
携手共进,共赴“星河”-2025 年“星河产业应用创新奖”火热申报中!

13 大技术 & 行业赛道全面开启,角逐年度 AI 应用桂冠

Claude Opus 4.5夺回编程王座,超Gemini 3 Pro和GPT-5.1
Claude Opus 4.5 夺回编程王座,超 Gemini 3 Pro 和 GPT-5.1

AI 编程之王又易主了。Pro。目前测试版(Beta 版)已上线,开发者可直接通过 Claude API 调用。

又一家AI创企爆雷:CEO 宣称估值近千亿,但融资和投资人凭空消失,网友还扒出创始人学历造假
又一家 AI 创企爆雷:CEO 宣称估值近千亿,但融资和投资人凭空消失,网友还扒出创始人学历造假

法律和金融专业人士把“爆雷”定义为通过隐瞒真实经营情况、财务造假或欺诈,让投资者蒙受重大损失的行为。

Nexla 发布对话式 AI 数据工程平台  Express
Nexla 发布对话式 AI 数据工程平台 Express

Nexla 推出对话式数据工程平台 Express,旨在大幅降低为 AI 应用构建数据管道的门槛。

35岁外包被裁,他选择“一键复仇”:“黑”进系统重置 2500 个密码,直接让前东家损失600多万 !
35 岁外包被裁,他选择“一键复仇”:“黑”进系统重置 2500 个密码,直接让前东家损失 600 多万 !

裁员往往会让前员工带着对系统漏洞的深入了解离开,一旦心怀不满,就很容易变成“内部威胁”。

AI Agent在微软的Magentic Marketplace模拟中未能通过操纵测试
AI Agent 在微软的 Magentic Marketplace 模拟中未能通过操纵测试

微软的研究人员与亚利桑那州立大学合作,推出了 Magenti Marketplace,这是一个开源的模拟环境,旨在研究基于大型语言模型(LLM)的 Agent 在多 agent 经济系统中的行为。随着自主 agent 在软件开发、客户服务和战略谈判中的能力增强,这个平台满足了人工智能研究中日益增长的需求。

全球首发!Vionbotics推出AI智能立面清洁机器人,破解全球清洁行业用工与成本困局
全球首发!Vionbotics 推出 AI 智能立面清洁机器人,破解全球清洁行业用工与成本困局

近日,上海具身智能设备有限公司(品牌名:Vionbotics)重磅发布行业领先的 AI 驱动具身智能立面清洁机器人。作为全球首款量产的立体空间清洁设备,该产品专为机场、商场、写字楼等公共空间设计,采用“全向移动底盘 + 机械臂 + 专业末端工具”的最优形态,有效破解传统清洁行业痛点,标志着具身智能技术在商用清洁垂直场景中迈入规模化应用新阶段。

亚马逊云科技服务中断暴露了关键云基础设施的脆弱性
亚马逊云科技服务中断暴露了关键云基础设施的脆弱性

2025 年 10 月 20 日,亚马逊云科技的服务(AWS)遭遇重大故障,导致其全球互联网服务中断,影响了 60 多个国家的数百万用户和数千家公司。

从训练数据、代码到构建细节,LLaVA-OneVision-1.5要做“全开源”
从训练数据、代码到构建细节,LLaVA-OneVision-1.5 要做“全开源”

开源,是当下大模型领域的热门趋势。但大多数开源模型只是开源了模型权重和一部分代码,不提供完整的训练数据和过程细节。

报告发现:AI生成的代码将引发新一轮技术债务浪潮
报告发现:AI 生成的代码将引发新一轮技术债务浪潮

Ox Security 新发布的报告指出,AI 生成的代码“功能强大,但在架构判断方面存在系统性不足”。在 10 月下旬发布的一份名为“初级军团:AI 代码安全危机”的报告中,AI 应用安全(AppSec)公司 Ox Security 列出了在 AI 生成的代码中常见的 10 种架构和安全反模式。

从模型到智能体:Snowflake 的企业级 Agentic AI 工程化之路
从模型到智能体:Snowflake 的企业级 Agentic AI 工程化之路

随着大语言模型迈向 Agentic AI,企业在从功能验证到规模化落地的过程中,面临安全、效率与信任等多重挑战。没有坚实的数据基座与系统化的工程方法,AI 难以真正转化为业务智能。 Snowflake 亚太及日本地区解决方案工程副总裁杨扬在  2025 QCon 全球软件开发大会(上海站)分享了通过 Snowflake 的研发实现企业级 Agentic AI 的部署,从而重塑智能生产力,实现从“大模型”到“可控智能体”的跃迁。

新的IBM Granite 4模型通过可高效推理的混合Mamba-2架构降低人工智能成本
新的 IBM Granite 4 模型通过可高效推理的混合 Mamba-2 架构降低人工智能成本

IBM 最近宣布了 Granite 4.0 系列小语言模型。与更大规模的模型相比,该模型系列旨在提供可接受准确性的同时,提供更快的速度和显著降低的运营成本。Granite 4.0 采用了新的混合 Mamba/transformer 架构,大大减少了内存需求,使 Granite 能够在成本显著更低的 GPU 上运行。

汇聚全球顶尖科学力量,中关村两院发布全球首个科研智能体系统,并公布2025前沿科技进展与2026未来重大突破预测
汇聚全球顶尖科学力量,中关村两院发布全球首个科研智能体系统,并公布 2025 前沿科技进展与 2026 未来重大突破预测

AI for Science 是 AI 的机遇,是科学的机遇,也是中国与全球的机遇。

谷歌24亿美元买个壳?劈柴哥力推的王牌IDE被爆“复制”Windsurf,连Bug一起
谷歌 24 亿美元买个壳?劈柴哥力推的王牌 IDE 被爆“复制”Windsurf,连 Bug 一起

一边是“抄作业”,另一边,创始人本人却在公共叙事中主动与 Windsurf“切割”。

2025深圳国际金融科技大赛十强名单揭晓,12月6日深圳大学决赛见!
2025 深圳国际金融科技大赛十强名单揭晓,12 月 6 日深圳大学决赛见!

12 月 5 日 -7 日,本届大赛的总决赛及颁奖典礼将在深圳大学举行

Code Arena正式发布,成为现实世界AI编程性能测试的新基准
Code Arena 正式发布,成为现实世界 AI 编程性能测试的新基准

它注重代理行为,允许模型在模拟实际开发工作流的受控环境中规划、搭建框架、迭代和完善代码。

  • 用户头像
    关注

    InfoQ高级编辑

  • 用户头像
    关注

    暂无签名

  • 用户头像
    关注

    前InfoQ编辑

    突破参数知识边界:自增强优化的检索增强大模型技术
    突破参数知识边界:自增强优化的检索增强大模型技术

    庞亮 博士 | 中国科学院 副研究员

    立即下载
    无极低代码UI可视化的AIGC落地与实践

    苑宗鹤 | 腾讯 PCG前端技术专家

    立即下载
    生成式 AI 在产品设计和 UI 领域:过去、现在和未来

    张昊然 | 妙多 副总裁

    立即下载