亮网络解锁器,解锁网络数据的无限可能 了解详情
写点什么

大模型时代,企业如何打造 AI 数据基础设施?

  • 2023-09-20
    北京
  • 本文字数:3051 字

    阅读完需:约 10 分钟

大小:1.64M时长:09:32
大模型时代,企业如何打造 AI 数据基础设施?

9 月 19 日,AI 基础设施公司 Fabarta 在北京举办首届产品与用户大会,本次大会以“数联世界 智见未来”为主题,汇聚前沿技术与商业洞见,来自学术界、投资界、以及 Fabarta 的客户、合作伙伴、各行业大咖共同分享  AI 赋能业务新范式的多种路径,探讨大模型时代企业如何打造 AI 数据基础设施,迈入真正的全面智能化时代。

构建面向智能应用的数据基础设施

 

当前 AIGC 技术快速发展,企业面临数字化转型和智能化升级的历史机遇。Fabarta 创始人兼 CEO 高雪峰在“数联世界、智见未来”的主题演讲中指出,构建面向智能应用的数据基础设施,是助力企业实现决策智能化的关键所在。

 

Fabarta 构筑了以数据为中心的 AIGC 落地架构范式,围绕着数据以及数据之间的关系(图和向量融合)所代表的企业数据,可以帮助大模型进行推理增强,减少模型的幻觉,实现数据的安全可控,并为其提供长效记忆能力。同时,也可以为其本地数据的 fine-tune 及预训练提供结构化的数据集。此外,作为本地知识库可以不断地进行知识的沉淀,提供可解释的智能,并为 AI Agents 打造核心的数据引擎。

 

Fabarta 创始人兼 CEO 高雪峰表示,Fabarta 不止将数据和数据之间显性、确定的关系记录在数据引擎中,通过向量的距离计算,还可以找到数据之间的丰富的隐含关系,成为了真正 AI 时代可以自生长的有机数据记忆体。 

 

高雪峰强调,Fabarta 致力于打造的是这个时代创新的数据基础设施,希望 Fabarta 的产品,可以帮助万千企业打造核心的面向智能应用的数据基础设施,从而更好,更方便,更加放心地将包括生成式人工智能技术在内的智能技术应用到企业决策智能领域,最终带来业务价值的巨大飞跃。抓住机遇,以数据为核心,构建支持智能化的架构,将是产业变革和发展的关键路径。

 

Fabarta 联合创始人兼 CTO  杨成虎在演讲中深入探讨了企业智能发展的新引擎——多模态智能引擎 ArcNeural。他强调,在强人工智能的背景下,企业知识数据与大型模型之间的互补性,企业私有数据的潜在价值,以及将私有知识与智能应用紧密结合的必要性。

 

杨成虎还详细分享了 ArcNeural 存查算一体的数据管理能力,并结合大模型技术实现智能化、可追溯、可解释的数据洞察能力。ArcNeural 架构面向云原生,并同时支持图与向量的同表管理。此外,在数据计算分析能力基础之上,利用大模型的智能化生成多模态查询计划,以此支持严谨的企业级多模态数据洞察。  最后,他还现场展示了多模态引擎 ArcNeural 结合 ArcFabric、ArcPilot,利用一体两翼范式在 Fabarta 企业内实施的一个 Copilot 系统--Arc42,Arc42 集成了代码、文档、组织关系等多模态数据,协同大模型显著提升企业效能。他表示:“计算 &存储是过去,推理 &记忆才是未来”。

 

Fabarta 联合创始人兼 CPO 仲光庆分享了产品矩阵的设计思路和出发点。Fabarta 经历了从 DB for AI 到大模型时代 AI 基础设施的演进过程。他表示:“当前大模型时代,企业面临从数据、模型到业务落地的全链路挑战,构建融合图数据库和向量数据库的新型数据基础设施,实现数据治理、知识管理和模型记忆,是应对大模型时代的关键。通过低代码平台加速场景化应用落地,企业更关注数据资产与业务价值的产出是智能化新范式,Fabarta 打造的‘一体两翼’产品矩阵,以多模态引擎为基础,数据与 AI 平台为双翼,为企业提供全链路支持,助力企业实现决策智能化”。

AI 时代数据基础设施的学术研究与行业思考

 

会上,Fabarta 科学顾问,国家杰青和优青基金获得者,北京理工大学特聘教授、大数据研究院院长袁野做了“AI 时代数据基础设施新范式的研究与应用”的学术分享。

 

袁教授围绕 AI 视角、数据视角和案例分析三个角度展开讲解,他认为,在 AI 视角,连接主义是模型实现基础,符号系统是高层能力特征,两种基础范式的结合是人工智能发展的必经之路,可以通过图知识增强大模型。 在数据视角,神经符号化的融合方式实现一体化数据管理。通过三个案例分析 —多模态图谱查询、视频数据分析和神经符号数据库,给出 AI 时代数据基础设施新范式的案例参考。

 

随着 AI 时代的技术演进,数据基础设施也在持续更新和迭代中。中国信通院云计算与大数据研究所大数据与区块链部副主任马鹏玮指出,AI 和数据基础设施正在双向奔赴,AI 赋能数据基础设施升级,数据基础设施助力 AI 产业发展。

 

马鹏玮认为,AI 赋能数据基础设施升级,通过数据存算+AI,诞生自治数据库;通过数据管理+AI,诞生智能数据管理工具;通过数据分析+AI :诞生增强型数据分析工具。数据基础设施助力 AI 产业,通过隐私计算、防篡改数据库、全密态数据库和多模态数据编织实现“汇数”,通过向量数据库实现“炼模”,通过图、向量和大模型相结合的技术,实现“用模”。

Fabarta 如何助力企业实现数智化转型?

 

当前,Fabarta 已经通过“一体两翼”产品矩阵帮助金融、制造、医疗等多个行业客户解决业务中的问题,并且成功实施落地。

 

泰康养老作为保险行业头部企业,利用 Fabarta 产品进行数据资产项目落地。 泰康养老数据基建部总经理吴坚平提到,金融保险行业数据资产管理工作中,数据量级爆炸性增长、数据类型多种多样、数据质量需求、数据合规性要求严,数字化建设过程中对于数据资产工具的需求越来越高,亟需智能化工具和产品可以解决以上痛点和问题。

 

通过 Fabarta ArcFabric 产品以及图和 AI 的能力,泰康养老已经构建从数据到资产、从资产到服务的全链路。在数据资源纳管阶段,实现元数据主动采集,利用 ArcGraph 进行血缘分析;利用 AI 技术实现元数据智能补齐、资产智能分类,构建数据资产大图;结合资产运营、资产评估,通过对话式数据看板等方式提供一站式数据资产服务。泰康养老已实现数据资产管理、数据治理与数据研发的协同以及治研一体的管理落地,未来会与 Fabarta 进行数据编织领域更深入的探索和落地。

 

大树科技是专注于智能企服及供应链数字技术的高新技术企业,利用产业链场景数据丰富小微客户画像,通过智能风控手段对客户实现精准的风险分层,实现风险可控的同时为特定产业内的上下游小微客户提供便利的普惠金融服务。大树科技风控和大数据负责人申宇峰带来“图解复杂,洞察价值 图智能助力业务创新”的分享。申宇峰指出,图数据库和图算法的应用已成为金融风控的新趋势,可以通过多跳复杂关系发现隐藏在孤立统计信息背后的关系和价值。

 

申宇峰表示,大树科技利用 ArcGraph 和 ArcPilot 产品,结合海量企业数据和交易数据,构建企业图谱和交易图谱,开展企业图谱业务分析、交易流水分析以及团伙欺诈分析,及时发现关联风险从而有效避免损失。在落地实践中,可以利用 ArcPilot 的图计算能力、灵活可配置画布功能以及行业模版提升图应用开发速度,沉淀图分析场景数据资产。大树科技期待与 Fabarta 进行更多合作和共创,从图智能扩展到大模型与图融合等更多领域。

 

亨通数科是一个面向全球工业装备提供从平台建设、数据应用到知识服务的全栈式产品服务商。亨通数科产品总监董晓健带来 “新一代设备全生命周期管理 — 多模态智能引擎,红海突围的利器”的分享。

 

董晓健指出,“在产品开发中,需要深挖市场需求和设备管理痛点。亨通数科利用 Fabarta ArcNeural 多模态智能引擎,打造新一代设备全生命周期管理软件。多模态智能引擎提供图、向量和大模型融合能力,可以为设备管理从工单录入与生成、设备故障与维修推荐、设备维修知识总结、设备技改方向选择等各环节提供支撑;同时可以利用向量代表的模糊性知识到图代表的确定性知识的转换,实现知识迁移和衍生,已经沉淀的知识可以在不同工厂复制,也可以在不同行业衍生。”

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-09-20 17:174321

评论

发布
暂无评论
发现更多内容

干货丨小程序开发秘籍,华为云这款服务器才是真香系列

YG科技

idea如何新建一个多模块的springCloud项目

javaNice

Java SpringCloud

阿里云崩溃损失大?华为云耀云服务器L实例为企业保驾护航

YG科技

剧情继续:马斯克曝出OpenAI前员工举报信,董事会与奥特曼谈判回归

Openlab_cosmoplat

如何获取item_search_guang API中与“爱逛街”相关的API接口?

技术冰糖葫芦

API 文档

低代码PaaS开发平台

树上有只程序猿

低代码 PaaS 私有化部署

软件测试/测试开发丨人工智能时代软件测试的变化

测试人

人工智能 软件测试

人工成本高企?华为云耀云服务器L实例打通企业网站开发最后堵着

YG科技

OmniGraffle Pro for mac(思维导图软件)v7.22.4激活版

mac

苹果mac Windows软件 OmniGraffle Pro 图形设计工具

JD-GUI 反编译jar包

javaNice

Java

引爆双11消费新热潮!华为云高性能轻量应用服务器“C位”耀眼

平平无奇爱好科技

和鲸携手暨大经管,为复合型、应用型数据人才培养工作提供最佳实践

ModelWhale

人工智能 数据分析 经管 交叉学科 暨南大学

为中小企业发展按下“提速键”,华为云这款轻量应用服务器成双11爆款

YG科技

cad2024 mac版更新 最新AutoCAD 2024中文破解版下载

iMac小白

MySQL大表设计

EquatorCoco

MySQL 数据库 数据库云

杭州悦数出席 2023 云栖大会计算巢专场,分享云上最佳实践

悦数图数据库

数据库 图数据库 悦数 杭州悦数

火山引擎ByteHouse:如何优化ClickHouse物化视图能力?

字节跳动数据平台

数据库 大数据 云原生

如何在淘宝的item_search_seller API中获取店铺列表?

技术冰糖葫芦

API 文档

PDF Expert for mac(pdf编辑工具) v3.7.1永久激活版

mac

PDF Expert 苹果mac Windows软件 PDF编辑和阅读工具

低代码:数字化转型趋势下的快速开发方式

互联网工科生

低代码 数字化

一个工具让你明白“万丈高楼平地起”,拒绝重复造轮子!

伤感汤姆布利柏

编程 程序员 前端 低代码

IT打工人避雷针!华为云这款轻量应用服务器是网站开发“神器”

YG科技

pdf增强插件Enfocus PitStop Pro 2020 for Mac下载

iMac小白

CleanMyMac X for mac下载 优化清理软件

iMac小白

Nginx配置Websocket

EquatorCoco

HTTP websocket 协议解析

悦数图数据库 v3.6.0 发布:支持 Zone 管理,提升业务安全性和连续性

悦数图数据库

图数据库 悦数 杭州悦数

HarmonyOS NEXT如何解决不同多媒体技术开发难题

Geek_2d6073

跨境选品工具推荐|这些选品神器,跨境卖家都在用!

Geek_ccdd7f

小程序开发“巨坑”多,华为云这款轻量应用服务器轻松避坑

YG科技

多个云平台,撑着零售消费企业们向上爬坡中

ToB行业头条

HashMap HashTable ConcurrentMap 中key value是否可以为null

javaNice

Java

大模型时代,企业如何打造 AI 数据基础设施?_生成式 AI_凌敏_InfoQ精选文章