写点什么

金融领域大模型数据集管理与应用|AICon 上海

  • 2025-04-23
    北京
  • 本文字数:970 字

    阅读完需:约 3 分钟

大小:536.46K时长:03:03
金融领域大模型数据集管理与应用|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


蚂蚁集团数据研发专家史鑫鑫已确认出席 AICon 上海并将在AI for Data,数据管理与价值挖掘实践专题发表题为《金融领域大模型数据集管理与应用》的主题分享。在金融科技快速发展的当下,数据质量已成为大模型应用效果的关键因素之一。本次演讲将聚焦于灵雨平台在金融垂直领域的数据管理实践,介绍其在多源异构数据整合、高质量 Chain-of-Thought(CoT)数据构建流程、多模态数据处理与质量控制等方面的技术实现。我们将详细解析平台的整体架构设计、核心算法机制与系统落地方案,分享如何构建从原始数据采集、加工到模型驱动决策的闭环体系,以支撑金融业务的智能化升级。


史鑫鑫作为蚂蚁集团数据研发专家,负责大模型数据集研发、CoT 思维链数据研发、多模态数据增强、数据质量管理,以及数据管理与应用平台研发。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 引言与背景

  • 金融科技的发展与数据挑战

  • 大模型数据全生命周期管理的重要性

2. 平台定位与技术核心

  • 系统架构与技术路线

3. 智能数据集管理

  • 多源异构数据整合

  • 精细化数据管理

  • 端到端智能应用赋能

4. CoT 思维链数据工厂

  • 高质量 CoT 数据构建原理

  • 定制化 CoT 数据构建 Pipeline

5. 多模态数据管理与应用

  • 多模态数据增强技术

  • 多模态数据质量管理

  • 多模态数据在金融场景的应用

6. 实际场景中的数据管理与应用案例

7. 总结与展望


听众收益:

  • 深入了解金融领域大模型数据全生命周期管理的关键技术与架构实践,掌握从数据获取到智能决策支持的完整流程

  • 掌握高质量 CoT 数据构建与多模态数据管理方法,助力在金融场景中落地智能化应用


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-23 14:004820

评论

发布
暂无评论
发现更多内容

2023-04-28:将一个给定字符串 s 根据给定的行数 numRows 以从上往下、从左到右进行 Z 字形排列 比如输入字符串为 “PAYPALISHIRING“ 行数为 3 时,排列如下 P

福大大架构师每日一题

Go 算法 rust 福大大

算法题每日一练:螺旋矩阵 I

知心宝贝

数据结构 算法 前端 后端 三周年连更

切片的其他妙用

宇宙之一粟

Go 切片 三周年连更

Matlab实现机器学习

袁袁袁袁满

三周年连更

Bash 脚本中,特殊变量$0到底是什么?

wljslmz

bash Linux 三周年连更

如何评价 ChatGPT 回答策略的 ensure only ethical usage 特质

汪子熙

ChatGPT ChatGPT4 三周年连更

Qz学算法-数据结构篇(二分查找、删除)

浅辄

三周年连更

LoRA: 大语言模型个性化的最佳实践

Zilliz

Towhee 大语言模型

Go 方法接收器:选择值接收器还是指针接收器?

陈明勇

Go golang 方法 三周年连更 方法接收器

Java注解编译期处理AbstractProcessor详解

石臻臻的杂货铺

Java

大模型“涌现”的思维链,究竟是一种什么能力?

脑极体

人工智能

什么是对象存储?对象存储的原理是什么?有哪些开源的、非开源的对象存储服务?

Java架构历程

对象存储 三周年连更

城市的智能进化,汇成数字中国的璀璨银河

脑极体

智慧城市

挑战 30 天学完 Python:Day14 高阶函数

MegaQi

挑战30天学完Python 三周年连更

火山引擎云原生数据仓库ByteHouse技术白皮书V1.0 (Ⅵ)

字节跳动数据平台

大数据 数据仓库 云原生 元数据 企业号 4 月 PK 榜

Windows下 IDE工具常见编译错误FAQ

鸿蒙之旅

OpenHarmony 三周年连更

轻松处理pdf文件:Acrobat Pro DC 2023 中文激活版

真大的脸盆

Mac Mac 软件 PDF编辑 pdf编辑工具

读书笔记:如何成为某个领域的前1%

老张

读书笔记 方法 写作技巧

Matlab实现最优化

Shine

三周年连更

高效理解机器学习

俞凡

机器学习 算法

《底层逻辑2:理解商业世界的本质》

石云升

读书笔记 三周年连更

我们如何将 Amazon Snowcone 送入轨道

亚马逊云科技 (Amazon Web Services)

挑战 30 天学完 Python:Day15 错误类型

MegaQi

挑战30天学完Python 三周年连更

手撕代码系列(三)

Immerse

JavaScript 前端面试题 手撕代码 ES6-ES12 面试必考

《流畅的Python》第二版上市了,值得入手么?

Python猫

Python

2023阿里云合作伙伴大会-主论坛回顾

科技pai

阿里云 伙伴大会 2023阿里云合作伙伴大会

深入探讨Go语言中Semaphore信号量的机制原理

Jack

CDH安装与部署

乌龟哥哥

三周年连更

音视频八股文(8)-- h264 AnnexB

福大大架构师每日一题

音视频 ffmpeg 流媒体

极速上手使用Docker,这篇文章就够了!

浅羽技术

Java Docker centos 容器化 三周年连更

通过华为云ECS云服务器搭建安防视频监控平台

DS小龙哥

三周年连更

金融领域大模型数据集管理与应用|AICon 上海_大数据_AICon 全球人工智能开发与应用大会_InfoQ精选文章