【AICon】硅谷视野+中国实践,汇聚全球顶尖技术的 AI 科技盛会 >>> 了解详情
写点什么

明略科技开源 TensorBoard.cpp,助力大模型预训练

  • 2023-08-11
    北京
  • 本文字数:749 字

    阅读完需:约 2 分钟

明略科技开源TensorBoard.cpp,助力大模型预训练

近日,明略科技集团实现了机器学习可视化工具——TensorBoard 的 C++接口,进一步丰富了基于 C++的大模型项目工具集,使得大模型预训练过程监控更加便捷、高效,加速营销领域大模型预训练进程。该工具已在 Github 开源。

 

TensorBoard 是 Google 开发的一款机器学习可视化工具,常用于监测机器学习过程的各项指标。明略科技高级技术总监赵亮介绍:“在大模型训练过程中,数据监测是一个重要维度,而 TensorBoard 通过可视化模型中的各种参数和结果,例如记录大模型训练过程的 Loss 变化、验证集的 PPL 变化、学习率变化、Token 消耗量、单步参数更新时延等指标,帮助分析训练状态,发现训练过程中出现的问题并及时采取干预措施,提升大模型训练进程和效果。”

 

此前,TensorBoard 仅支持 Python 语言接口。此次明略科技通过 C++实现 TensorBoard,将进一步丰富基于 C++实现的大模型项目工具集,大幅提升模型训练监测效率,加速模型训练进程,改写接口后的工具将通过多维度的数据模式展示训练指标,包括标量、直方图、图像、图像合集、音频、文本等数据模式。该工具包通过 github 项目 Tensorboard.cpp 分享,助力更多研究者和开发者参与并加速大模型的研发进程,推动人工智能多领域的应用探索。

 

明略科技在 Github 开源的两款工具包:ASR-BlockFormer 与 tensorboard.cpp

 

明略科技集团 CTO 郝杰表示:


“我们要在更高效、更低成本的要求下做出营销领域的大模型,通过自适应技术提升大模型的能力。好的行业大模型需要具备通用大模型的逻辑性、语言顺畅度,同时还需要实现通用大模型所不具备的,在某个行业内或具体的领域中的真实性、专业性。明略科技凭借 17 年来积累的海量行业数据为基础,从客户实际需求出发,借助庞大的数据和知识库进行增强训练,满足客户多样化的任务和场景需求。力求为客户打造一个更加可靠、效果更好的行业大模型。”

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-08-11 17:353721
用户头像
李冬梅 加V:busulishang4668

发布了 824 篇内容, 共 393.8 次阅读, 收获喜欢 1010 次。

关注

评论

发布
暂无评论
发现更多内容

时序数据库 IoTDB 发布端边云原生解决方案,有效优化工业互联网数据上传时效与资源消耗

Apache IoTDB

infoQ 迁移开始

愤毛阿青

专访中欧财富伍春兰:财富管理行业数字化转型升级,数据库如何选型?

PingCAP

数据库 TiDB

用低代码开发工具高效构建企业门户

力软低代码开发平台

无代码开发和低代码开发的本质区别

互联网工科生

无代码开发 低代码开发 JNPF

GameFi游戏NFT链游开发系统搭建技术

西安链酷科技

gamefi NFT链游 链游开发

WorkPlus打造智慧企业移动门户,开启高效办公新时代

WorkPlus

用户案例|Shopee 在多媒体理解业务的向量检索系统实践

Zilliz

非结构化数据 Milvus Shopee Zilliz 向量数据库

任正非“苹果是华为的老师”;音频编解码标准 L2HC 发布;GNU 和自由软件运动四十周年丨RTE开发者日报 Vol.53

声网

怎么使用cpu调用SDK进行开发?

矩视智能

机器视觉

如何用人工智能加速研发进程

PingCode

人工智能 AI 研发管理

企业数据安全重要?私有化部署IM,保障信息安全无忧虑!

WorkPlus

提升开发效率的低代码思路

树上有只程序猿

软件开发 低代码 可视化开发

重装亮相!9 月 22 日平凯数据库 - TiDB 企业版全解读等你来!

PingCAP

数据库 TiDB 平凯星辰 平凯数据库

保护你的iOS应用,防止逆向破解

雪奈椰子

C++中的四种类型转换运算符

智趣匠

数字货币合约交易平台开发,合约社区智能跟单平台

V\TG【ch3nguang】

豆瓣评分9.6!Mybatis技术原理实战

程序员万金游

mybatis #java #Spring #后端

最佳实践:TiDB 业务写变慢分析处理

PingCAP

数据库 最佳实践 TiDB

现货合约量化交易机器人模式开发搭建

V\TG【ch3nguang】

低代码平台技术分享官丨日志实时隔离,助力高效发布

inBuilder低代码平台

低代码

拍卖软件开发公司、成熟源码显著优势

软件开发-梦幻运营部

安全保护策略:iOS应用程序代码保护的关键步骤和技巧

WorkPlus局域网即时通信软件,打造高效协作的智能选择

WorkPlus

独享http代理与普通http代理相比,独享贵的因素有哪些?

巨量HTTP

代理IP http代理

静态分析在DevSecOps中的应用

Tom(⊙o⊙)

金融业需要的大模型,是一个系统化工程

脑极体

大模型

QCN9074 QCN9024|Qualcomm Tri-band M.2 PCIE4X4 WIFI6E MU-MIMO Network Card DR9074

wallyslilly

QCN9074 QCN9024

Lightroom Classic 2023 for Mac(摄影后期图像编辑工具) v12.4中文激活版

mac

windows 图像处理软件 苹果mac Lightroom Classic 2023 lrc

分享团队在软件开发中用到的神仙工具

这我可不懂

JNPF 低代码开发工具

企业该如何迈好降本增效的第一步?

ToB行业头条

明略科技开源TensorBoard.cpp,助力大模型预训练_生成式 AI_李冬梅_InfoQ精选文章