写点什么
创作场景
- 记录自己日常工作的实践、心得
- 发表对生活和职场的感悟
- 针对感兴趣的事件发表随笔或者杂谈
- 从 0 到 1 详细介绍你掌握的一门语言、一个技术,或者一个兴趣、爱好
- 或者,就直接把你的个人博客、公众号直接搬到这里
登录/注册
收录了 网络技术模型架构 频道下的 50 篇内容

AI 训练和推理过程中遇到的痛点问题及其创新解决方案。

中台说到底也是一种业务架构设计结果,回顾软件设计的发展历程,中台也不是石头中蹦出来的齐天大圣,它并非一种超越了企业架构这个概念的存在,因此,想要深入理解中台设计方式,多去学习下业务架构、软件架构的发展历程还是有帮助的。

ScalingLaw是不是大模型的唯一方向?

本次分享介绍腾讯的由特征工程、训练平台、线上 Serving 组成的深度学习技术架构。

深度学习模型能够被压缩,本质上是因为参数的冗余,因此可以采用参数更少、结构更稀疏或者更低精度的运算来代替。

本文是架构设计实践五部曲系列文章的第一篇,架构与架构图。本文将对架构作深入的阐释,并教你什么时候画架构图、怎么画架构图。

AI 训练场景的算力 Scaling 核心是网络,依赖于大规模、高性能的数据中心网络集群来实现算力的规模扩展

本文是架构设计实践五部曲系列文章的第五篇,技术架构的战略和战术原则。本篇讲述如何保证在做技术架构时,实现一个稳定、出色的系统。

行业首发,弥补大模型在网络安全垂类领域评测空白

业务架构从诞生之初就很清楚地定义了自己的使命:面向复杂系统构建。未来,业务不再仅仅是业务,技术也不再仅仅是技术,谁先实现思维方式的改进,谁就能赢得转型的先手,而业务架构能力可以在这方面发挥关键作用。

本文转载自技术琐话公众号

别怕AI抢饭碗,它正逼着我们进化。

在 AICon 北京 2019 大会上,夏磊讲师做了《分布式深度学习训练》主题演讲。

AIGC的爆发除了带来算力上的挑战,对网络的要求也达到了前所未有的高度。

的直播技术已无法满足这一诉求。在这种大趋势和自身业务发展需要的驱动下,作业帮研发了一套适应这种诉求的高并发低延迟互动直播系统,并已投入到生产环境稳定运行。

业务架构设计需要考虑哪些因素?业务架构设计的难点和挑战是什么?

本文主要以点击率 (Click-Through Rate, CTR) 预估技术这个战场来展开叙述。

“我们员工从来不是paper-driven的去做研发”

随着 AI 接入门槛和成本的降低,金融、医疗、教育和汽车等行业的应用可能会率先爆发。

ChatGPT 的爆火掀起了 AI 大模型狂飙热潮,随着国内外原来越多的 AI 大模型应用落地,AI 算力需求快速增加。在算力的背后,网络起到至关重要的作用——网络性能决定 GPU 集群算力,网络可用性决定 GPU 集群算力稳定性。因此,高性能与高可用的网络对 AI 大模型的构建尤为重要。