【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

明略科技开源 TensorBoard.cpp,助力大模型预训练

  • 2023-08-11
    北京
  • 本文字数:749 字

    阅读完需:约 2 分钟

明略科技开源TensorBoard.cpp,助力大模型预训练

近日,明略科技集团实现了机器学习可视化工具——TensorBoard 的 C++接口,进一步丰富了基于 C++的大模型项目工具集,使得大模型预训练过程监控更加便捷、高效,加速营销领域大模型预训练进程。该工具已在 Github 开源。

 

TensorBoard 是 Google 开发的一款机器学习可视化工具,常用于监测机器学习过程的各项指标。明略科技高级技术总监赵亮介绍:“在大模型训练过程中,数据监测是一个重要维度,而 TensorBoard 通过可视化模型中的各种参数和结果,例如记录大模型训练过程的 Loss 变化、验证集的 PPL 变化、学习率变化、Token 消耗量、单步参数更新时延等指标,帮助分析训练状态,发现训练过程中出现的问题并及时采取干预措施,提升大模型训练进程和效果。”

 

此前,TensorBoard 仅支持 Python 语言接口。此次明略科技通过 C++实现 TensorBoard,将进一步丰富基于 C++实现的大模型项目工具集,大幅提升模型训练监测效率,加速模型训练进程,改写接口后的工具将通过多维度的数据模式展示训练指标,包括标量、直方图、图像、图像合集、音频、文本等数据模式。该工具包通过 github 项目 Tensorboard.cpp 分享,助力更多研究者和开发者参与并加速大模型的研发进程,推动人工智能多领域的应用探索。

 

明略科技在 Github 开源的两款工具包:ASR-BlockFormer 与 tensorboard.cpp

 

明略科技集团 CTO 郝杰表示:


“我们要在更高效、更低成本的要求下做出营销领域的大模型,通过自适应技术提升大模型的能力。好的行业大模型需要具备通用大模型的逻辑性、语言顺畅度,同时还需要实现通用大模型所不具备的,在某个行业内或具体的领域中的真实性、专业性。明略科技凭借 17 年来积累的海量行业数据为基础,从客户实际需求出发,借助庞大的数据和知识库进行增强训练,满足客户多样化的任务和场景需求。力求为客户打造一个更加可靠、效果更好的行业大模型。”

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-08-11 17:353718
用户头像
李冬梅 加V:busulishang4668

发布了 819 篇内容, 共 387.9 次阅读, 收获喜欢 1006 次。

关注

评论

发布
暂无评论
发现更多内容

测试流程复现第二弹!IoTDB 在国际数据库性能测试排行榜结果如何?

Apache IoTDB

兼顾集群与个人实践环境,和鲸聚焦 AI4S 科研算力高效调度管理

ModelWhale

人工智能 算力 数据驱动 AI for Science 计算资源

构建应用程序的低代码思路

这我可不懂

软件开发 低代码 应用程序配置 JNPF

语音识别技术的应用及未来发展

来自四九城儿

攀登数字化高峰,中小企业如何找“搭子”?

脑极体

华为云

2023 Bonree ONE 秋季产品发布会:亮点抢先看!

博睿数据

运维 可观测性

重磅发布|博睿数据IT运维最佳实践白皮书

博睿数据

运维 可观测性 白皮书

何为CI/CD,何为DevOps?8个方面全面对比解析

PingCode

DevOps 软件开发 CI/CD

语音识别技术的挑战与应对策略

来自四九城儿

公共卫生的未来:智慧公厕来了

光明源智慧厕所

智慧厕所 智慧公厕

腾讯云 Cloud Studio 实战训练营结营&活动获奖公示

CODING DevOps

2024工业皮带展|2024广州国际传输设备展会

秋硕展览

展会 输送装置

2500 万美元基金、完成 1.5 升级,Casper Network 构建企业级区块链的野望

股市老人

兴业数金:基于悦数图数据库的智能大数据云平台获 “2023 IDC中国 未来企业大奖”

最新动态

语音识别技术:深度理解与前沿趋势

来自四九城儿

秋招上岸“我”都做对了哪些事?

王磊

Java java面试

基于低代码平台少量编码完成软件开发

互联网工科生

系统开发 低代码开发 JNPF

明略科技开源TensorBoard.cpp,助力大模型预训练_生成式 AI_李冬梅_InfoQ精选文章