NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

国内首家 IC 上云企业 嘉楠科技谈如何实现开发成本最小化

  • 2019-08-23
  • 本文字数:3589 字

    阅读完需:约 12 分钟

国内首家IC上云企业 嘉楠科技谈如何实现开发成本最小化

随着产业链分工细化,IC 目前已发展出 IDM、IP 设计和 Fabless 三种主流开发模式。虽然今天的芯片研发门槛不断降低,但是在经典 IC 开发环境中,企业仍然面临计算资源缺乏、存储瓶颈等限制。作为国内首家 IC 上云企业,嘉楠科技选择在云端部署 IC 研发平台,HPC 管理,自建存储及优化,极大缩短开发周期,率先开启了国内 IC 上云的风潮。


8 月 16 日,由中科院微电子所、Fabless IT 社群主办,嘉楠科技承办的"集成电路 IT 技术研讨之云时代下的芯片设计暨 Fabless IT 走进嘉楠科技活动”在京举行。来自国内明星 IC 设计企业的 Fabless IT 从业者共聚嘉楠,围绕开源软件、IC 研发平台架构、集群调度技术等热门话题展开深入探讨,嘉楠科技还分享了 IC 设计上云方面的成果和经验。



Fabless IT 社群成员共聚嘉楠科技


说到Fabless,实际上是Fabrication(制造)+less,即"不做制造,专注设计"的IC设计模式。但随着芯片应用场景扩展和精细化,即使在经典的 IC 开发中,也面临EDA峰值性能需求难以被满足等一系列问题。因此,拥有灵活部署算力、可扩展迭代和数据安全存储等优势的云计算在芯片开发等领域存在广阔的应用价值。

嘉楠科技王轩哲:“上云可以让 IC 开发成本最小化”

作为本次活动的东道主,嘉楠科技高级工程师王轩哲在《高性能云计算服务在芯片设计领域的实践》的主题演讲中,从云计算优势、云上基础设施设计维护管理、云上与线下安全、云上 HPC 构建管理、自建存储优化与管理等层面分享了嘉楠科技在 IC 设计上云“第一次吃螃蟹”的经历。


IC 开发上云以后,开发者不需要考虑资源缺乏和复用等问题,管理者只需要关注业务本身的资源、人力和 EDA 成本。“上云可以让 IC 开发成本最小化”,王轩哲举了一个的例子来说明云端的“资源优势”:去年西数的一个项目通过上云,实现了 100 万颗 CPU 的调度,从而将该项目周期从月度缩短为 8 小时,实现了更为敏捷高效的 IC 开发。



嘉楠科技网络架构


在经典 IC 开发环境中,IC 团队和 IT 团队都面临着 EDA 峰值性能需求难以被满足;数据迁移,耗时费力;多项目并行导致资源抢夺,影响项目进度;运行时间长达数周的 EDA 进程因停电等外力因素中断;异地办公图像卡顿,以及数据安全等一系列问题的挑战。嘉楠科技通过代码描述、周期化管理、一次完成设计 &版本迭代回溯 &周期更新。“一个人管理一个全球化的私有网络”,王轩哲这样形容云端生产力的强大。


信息时代,数据安全是企业安全的底线,线上线下须统一设计规划管理。嘉楠科技从网络安全、存储安全、密钥安全等维度构建云上和线下安全体系,从而让客户明确当前核心数据安全情况以及使用授权时的二次认证或交叉真人应用类型,保证每次数据使用可查可控可信,保障 IC 开发上云的数据安全。其中,企业又该如何在云上数据管理中最大限度地利用资源呢?


王轩哲回答,企业需要一个完整的实例监控系统,最好能做到秒级的性能状态跟踪;同时需要一个日志处理系统,一方面满足审计的需求,一方面满足企业对错误状态的跟踪;除此之外,还需要改进旧有的开发方式从而节约流量开销。


基于此,嘉楠科技建立了云上性能分析和性能预警系统。如下图所示,嘉楠科技使用 Prometheus 技术栈定制采集所需各类监控信息的 node_export、netdata 与各类插件,并使用 Grafana 进行数据展示,同时进行告警、状态日志收集。



HPC(High Performance Computing) 是指利用计算能力来处理标准工作站无法完成的数据密集型计算任务。使用 MPI、OpenMP 或其他类型的并行库、作业数组和复杂的依赖性工作。


HPC 在 IC 开发上应用广泛。嘉楠科技通过各类调度器统一集成、制定流程方案等开展云上 HPC 构建管理,降低跨供应商 HPC 任务周期内实际成本;通过监控记录统计信息收集整理为任务模板,精准匹配 HPC 集群;研发自管理,解决出现垃圾 job 时资源缺乏和任务抢占等问题。


针对现在 IC 企业普遍面临的存储瓶颈,王轩哲从“监控先行、任务分析、通用场景模板”等讲述嘉楠科技自建存储优化与管理的历程。传统的工作负载生成器软件(如 Iometer 或 Vdbench)与其非本机操作系统的兼容性有限,或者它们难以为高性能存储设备如 RDMA/nfs/pcie/nvme 进行测试。 嘉楠科技选择基准测试工具来准确测量不同存储产品的性能。流程上首先分析驱动器在彻底预处理阶段的执行方式,使用供应商的工具安全地擦除每个可比较的产品。然后在相同的工作负载下预处理稳定状态,在 32 个线程(每个线程的队列为 32 个)的重负载下测试设备,进而完成整个过程。


通过周期性监控记录回收确认最适合嘉楠科技 EDA 任务使用场景的存储集群,其存储从一次性定点支出升级成周期性和单个任务绑定,从而 10 倍提升存储系统性能,大幅节约商用存储成本。

众专家热议 Fabless IT 行业热点

在随后的嘉宾分享环节,IC 极客/观柘科技创始人、“国内第一女 CAD”高艳丽(Alice Gao)在其《企业级 IC 研发平台构建》的主题演讲中,展示了包括基础设施、EDA 工具、流程、方法学、工程管理、资源及环境的 IC 研发平台的分层架构。


其中,HPC 层提供硬件、网络、信息安全和虚拟化服务。运维管理层提供终端服务,包括数据部署、集群管理、作业管理等。工具层主要涉及 EDA 工具、管理工具、环境及 License 管理。而 CAD 层聚焦实现下列内容:


  • IC 数据,环境,流程,设计及结果容器化,信息化管理,在 multi-site、multi-project、multi-task、multi-user 的协作管理中,提升基线,持续优化工程效率。

  • 基于版本管理、信息化管理、全配置管理及经验代码化,快速建立项目及 EDA 作业环境,在设计分析阶段,提升并行作业的能力及可移植性,并针对批量作业结果做统计分析,加速设计收敛。

  • 将度量体系内置于数据管理和流程构建,提升知识及经验代码化及可复用性,持续优化工程质量。


随后,Alice 通过梳理 IC 设计过程,以标准化、模块化和结构化的方式连接 EDA 工具链及流程,项目管理及运维管理。并介绍了 IC 研发平台成熟度模型。并结合企业级 IC 环节交付复杂、IC 数据类别多体量大、研发平台构建标准难统一等痛点,从业务视角对适配云思路的 IC 设计上云路径提出了实施建议。


Alice 认为,企业应持续优化质量和效率,将最大化 IC 研发投入 ROI。同时,企业应保持全局化、代码化、可视化三项原则构建企业级 IC 研发平台。


  • 全局化:EDA 流程环节整合优化,聚焦交付;跨部门跨环节沟通协作更顺畅;更好评估需求变更及插队任务。

  • 代码化:研发经验代码化;利用架构思维,避免重复造轮子;流程代码内建质量体系和度量标准。

  • 可视化:简单直观的研发过程引导;进度、等待、返工、浪费及数据质量实时(授权)真实可见;减少心口相传的管理及技术交流。


常青藤开源科技有限公司 CEO 黄迎春进行了《基础设施开源软件及其在 IC 运维领域的应用》的主题演讲。黄迎春从一张描绘持续演进的数据中心架构图,分别对 Linux、虚拟化平台、私有云 IaaS 平台、软件定义存储、容器化技术、自动化运维工具、系统自动化安装、系统监控、数据分析和可视化软件、统一账户管理软件等方面详细介绍了开源软件在基础运维层面的应用情况。并介绍其对于 IC 领域 IT 运维的理解,以及在 IC 运维领域推荐的开源软件和解决方案。


运算集群建立是 Fabless 公司进行高性能计算的基础,集群资源调度优化和效率提升是充分发挥集群计算效能的关键。某 CAD 专家在其《利用开源工具提升集群调度和管理的效率》的演讲中,结合 OpenLava、Jenkins、Django、MySQL 等开源工具,介绍如何搭建一个可供用户自查,实现自动化和可视化的平台的关键核心点——通过数据的分析方法体现对设计流程的理解。与会嘉宾出于各自从业经历,纷纷表示对使用开源工具将多个工具集成起来应用的巨大效能表示赞同。


此次活动吸引了 30 余名来自中科院微电子所和北京主要 IC 设计公司的 Fabless IT 社群成员参加。大家从云计算、CAD 技术、IT 运维、信息安全等专业领域,畅谈云时代的 IT/IC 行业热点和产业趋势,并高度评价此次嘉楠科技承办的 Fabless IT 主题活动。


在活动最后,本次活动的主要发起者、Fabless IT 社群负责人张书波总结到:随着集成电路行业成为国家核心基础行业,不断有新 IT 技术被引入 IC 行业。这也为广大 Fabless IT 从业者们提供了时代机遇。张书波倡议大家坚持“共享、互助、钻研、进步”,共同拓展 IT/CAD 影响力,以 IT 技术助力 Fabless 发展,共助中国芯的实现!


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-08-23 14:145380
用户头像
孙春鹭 InfoQ 编辑

发布了 27 篇内容, 共 10.4 次阅读, 收获喜欢 18 次。

关注

评论

发布
暂无评论
发现更多内容

解读Vue3模板编译优化

yyds2026

Vue

开发工具安装

青柚1943

马蜂窝毕博:分析完这9点工作原理,我们最终选择了 Apache SeaTunnel!

Apache SeaTunnel

开源 技术选型 数据集成 Seatunnel 数据集成平台

记一次TiDB数据库报错的处理过程

TiDB 社区干货传送门

管理与运维

文盘Rust -- 把程序作为守护进程启动

TiDB 社区干货传送门

开发语言

GPU服务器到底有什么作用?

Finovy Cloud

云渲染 GPU渲染 云渲染平台

干啥啥都行,这次又拿了第一名!

青藤云安全

网络安全 主机安全 青藤云安全

Vue.nextTick核心原理

yyds2026

Vue

聊聊Vuex原理

yyds2026

Vue

手写一个webpack插件

Geek_02d948

webpack

贯彻二十大报告精神,政企如何提前布局信创国产化移动数字化平台?

WorkPlus

Etcd API 未授权访问漏洞修复

TiDB 社区干货传送门

监控 实践案例 故障排查/诊断

【10.28-11.04】写作社区优秀技术博文一览

InfoQ写作社区官方

优质创作周报

集群并发下的数据覆盖问题

苏格拉格拉

缓存 分布式 并发 一致性

「百幄」之办公平台:进一道门,办所有事

融云 RongCloud

数字化 办公

设计模式学习-基础知识

肥晨

设计模式 11月月更 设计模式基础

使用Online unsafe recovery恢复v6.2同城应急集群

TiDB 社区干货传送门

实践案例 集群管理 管理与运维 数据库架构设计 6.x 实践

企业内部即时通讯工具WorkPlus,支持内网私有化部署

WorkPlus

企业上云四大优势简单聊聊-行云管家

行云管家

云计算 企业上云 云服务器

SQL 碎碎念,你可能用不到但不能不知道的数据库技巧(1)

百里丶落云

数据库 后端 11月月更

Spring Boot「24」DAO 模式与 Repository 模式

Samson

Java spring Spring Boot 学习笔记 11月月更

稳定性治理方法论

苏格拉格拉

方法论 稳定性

看直播,领报告 |《勒索软件的认识与防御指南》最新发布!

青藤云安全

网络安全 勒索病毒 主机安全 勒索 青藤云安全

深度解读Webpack中的loader原理

Geek_02d948

webpack

阿里云 ODPS-Hologres刷新世界纪录,领先第二名23%

阿里云大数据AI技术

大数据 交互式 ODPS 离线计算

量子编程实践:Bell Pair电路及Deutsch算法

启科量子开发者官方号

#python #量子计算 #人工智能 #AI框架

阿里云ODPS升级为一体化大数据平台 满足用户多元化数据计算需求

阿里云大数据AI技术

大数据 阿里云

从演进的视角理解微服务架构

苏格拉格拉

架构 微服务 微服务架构 架构演进

TiDB上云之TiDB Operator

TiDB 社区干货传送门

集群管理 TiDB 底层架构 管理与运维 数据库架构设计

嘉兴市等保测评公司有几家?叫什么名字?

行云管家

等保 等级保护 等保测评 安全等级保护 行云管家堡垒机

BI系统打包Docker镜像及部署的技术难度和实现

葡萄城技术团队

Docker 容器 BI

国内首家IC上云企业 嘉楠科技谈如何实现开发成本最小化_语言 & 开发_孙春鹭_InfoQ精选文章