写点什么

国内首家 IC 上云企业 嘉楠科技谈如何实现开发成本最小化

2019 年 8 月 23 日

国内首家IC上云企业 嘉楠科技谈如何实现开发成本最小化

随着产业链分工细化,IC 目前已发展出 IDM、IP 设计和 Fabless 三种主流开发模式。虽然今天的芯片研发门槛不断降低,但是在经典 IC 开发环境中,企业仍然面临计算资源缺乏、存储瓶颈等限制。作为国内首家 IC 上云企业,嘉楠科技选择在云端部署 IC 研发平台,HPC 管理,自建存储及优化,极大缩短开发周期,率先开启了国内 IC 上云的风潮。


8 月 16 日,由中科院微电子所、Fabless IT 社群主办,嘉楠科技承办的"集成电路 IT 技术研讨之云时代下的芯片设计暨 Fabless IT 走进嘉楠科技活动”在京举行。来自国内明星 IC 设计企业的 Fabless IT 从业者共聚嘉楠,围绕开源软件、IC 研发平台架构、集群调度技术等热门话题展开深入探讨,嘉楠科技还分享了 IC 设计上云方面的成果和经验。



Fabless IT 社群成员共聚嘉楠科技


说到Fabless,实际上是Fabrication(制造)+less,即"不做制造,专注设计"的IC设计模式。但随着芯片应用场景扩展和精细化,即使在经典的 IC 开发中,也面临EDA峰值性能需求难以被满足等一系列问题。因此,拥有灵活部署算力、可扩展迭代和数据安全存储等优势的云计算在芯片开发等领域存在广阔的应用价值。


嘉楠科技王轩哲:“上云可以让 IC 开发成本最小化”

作为本次活动的东道主,嘉楠科技高级工程师王轩哲在《高性能云计算服务在芯片设计领域的实践》的主题演讲中,从云计算优势、云上基础设施设计维护管理、云上与线下安全、云上 HPC 构建管理、自建存储优化与管理等层面分享了嘉楠科技在 IC 设计上云“第一次吃螃蟹”的经历。


IC 开发上云以后,开发者不需要考虑资源缺乏和复用等问题,管理者只需要关注业务本身的资源、人力和 EDA 成本。“上云可以让 IC 开发成本最小化”,王轩哲举了一个的例子来说明云端的“资源优势”:去年西数的一个项目通过上云,实现了 100 万颗 CPU 的调度,从而将该项目周期从月度缩短为 8 小时,实现了更为敏捷高效的 IC 开发。



嘉楠科技网络架构


在经典 IC 开发环境中,IC 团队和 IT 团队都面临着 EDA 峰值性能需求难以被满足;数据迁移,耗时费力;多项目并行导致资源抢夺,影响项目进度;运行时间长达数周的 EDA 进程因停电等外力因素中断;异地办公图像卡顿,以及数据安全等一系列问题的挑战。嘉楠科技通过代码描述、周期化管理、一次完成设计 &版本迭代回溯 &周期更新。“一个人管理一个全球化的私有网络”,王轩哲这样形容云端生产力的强大。


信息时代,数据安全是企业安全的底线,线上线下须统一设计规划管理。嘉楠科技从网络安全、存储安全、密钥安全等维度构建云上和线下安全体系,从而让客户明确当前核心数据安全情况以及使用授权时的二次认证或交叉真人应用类型,保证每次数据使用可查可控可信,保障 IC 开发上云的数据安全。其中,企业又该如何在云上数据管理中最大限度地利用资源呢?


王轩哲回答,企业需要一个完整的实例监控系统,最好能做到秒级的性能状态跟踪;同时需要一个日志处理系统,一方面满足审计的需求,一方面满足企业对错误状态的跟踪;除此之外,还需要改进旧有的开发方式从而节约流量开销。


基于此,嘉楠科技建立了云上性能分析和性能预警系统。如下图所示,嘉楠科技使用 Prometheus 技术栈定制采集所需各类监控信息的 node_export、netdata 与各类插件,并使用 Grafana 进行数据展示,同时进行告警、状态日志收集。



HPC(High Performance Computing) 是指利用计算能力来处理标准工作站无法完成的数据密集型计算任务。使用 MPI、OpenMP 或其他类型的并行库、作业数组和复杂的依赖性工作。


HPC 在 IC 开发上应用广泛。嘉楠科技通过各类调度器统一集成、制定流程方案等开展云上 HPC 构建管理,降低跨供应商 HPC 任务周期内实际成本;通过监控记录统计信息收集整理为任务模板,精准匹配 HPC 集群;研发自管理,解决出现垃圾 job 时资源缺乏和任务抢占等问题。


针对现在 IC 企业普遍面临的存储瓶颈,王轩哲从“监控先行、任务分析、通用场景模板”等讲述嘉楠科技自建存储优化与管理的历程。传统的工作负载生成器软件(如 Iometer 或 Vdbench)与其非本机操作系统的兼容性有限,或者它们难以为高性能存储设备如 RDMA/nfs/pcie/nvme 进行测试。 嘉楠科技选择基准测试工具来准确测量不同存储产品的性能。流程上首先分析驱动器在彻底预处理阶段的执行方式,使用供应商的工具安全地擦除每个可比较的产品。然后在相同的工作负载下预处理稳定状态,在 32 个线程(每个线程的队列为 32 个)的重负载下测试设备,进而完成整个过程。


通过周期性监控记录回收确认最适合嘉楠科技 EDA 任务使用场景的存储集群,其存储从一次性定点支出升级成周期性和单个任务绑定,从而 10 倍提升存储系统性能,大幅节约商用存储成本。


众专家热议 Fabless IT 行业热点

在随后的嘉宾分享环节,IC 极客/观柘科技创始人、“国内第一女 CAD”高艳丽(Alice Gao)在其《企业级 IC 研发平台构建》的主题演讲中,展示了包括基础设施、EDA 工具、流程、方法学、工程管理、资源及环境的 IC 研发平台的分层架构。


其中,HPC 层提供硬件、网络、信息安全和虚拟化服务。运维管理层提供终端服务,包括数据部署、集群管理、作业管理等。工具层主要涉及 EDA 工具、管理工具、环境及 License 管理。而 CAD 层聚焦实现下列内容:


  • IC 数据,环境,流程,设计及结果容器化,信息化管理,在 multi-site、multi-project、multi-task、multi-user 的协作管理中,提升基线,持续优化工程效率。

  • 基于版本管理、信息化管理、全配置管理及经验代码化,快速建立项目及 EDA 作业环境,在设计分析阶段,提升并行作业的能力及可移植性,并针对批量作业结果做统计分析,加速设计收敛。

  • 将度量体系内置于数据管理和流程构建,提升知识及经验代码化及可复用性,持续优化工程质量。


随后,Alice 通过梳理 IC 设计过程,以标准化、模块化和结构化的方式连接 EDA 工具链及流程,项目管理及运维管理。并介绍了 IC 研发平台成熟度模型。并结合企业级 IC 环节交付复杂、IC 数据类别多体量大、研发平台构建标准难统一等痛点,从业务视角对适配云思路的 IC 设计上云路径提出了实施建议。


Alice 认为,企业应持续优化质量和效率,将最大化 IC 研发投入 ROI。同时,企业应保持全局化、代码化、可视化三项原则构建企业级 IC 研发平台。


  • 全局化:EDA 流程环节整合优化,聚焦交付;跨部门跨环节沟通协作更顺畅;更好评估需求变更及插队任务。

  • 代码化:研发经验代码化;利用架构思维,避免重复造轮子;流程代码内建质量体系和度量标准。

  • 可视化:简单直观的研发过程引导;进度、等待、返工、浪费及数据质量实时(授权)真实可见;减少心口相传的管理及技术交流。


常青藤开源科技有限公司 CEO 黄迎春进行了《基础设施开源软件及其在 IC 运维领域的应用》的主题演讲。黄迎春从一张描绘持续演进的数据中心架构图,分别对 Linux、虚拟化平台、私有云 IaaS 平台、软件定义存储、容器化技术、自动化运维工具、系统自动化安装、系统监控、数据分析和可视化软件、统一账户管理软件等方面详细介绍了开源软件在基础运维层面的应用情况。并介绍其对于 IC 领域 IT 运维的理解,以及在 IC 运维领域推荐的开源软件和解决方案。


运算集群建立是 Fabless 公司进行高性能计算的基础,集群资源调度优化和效率提升是充分发挥集群计算效能的关键。某 CAD 专家在其《利用开源工具提升集群调度和管理的效率》的演讲中,结合 OpenLava、Jenkins、Django、MySQL 等开源工具,介绍如何搭建一个可供用户自查,实现自动化和可视化的平台的关键核心点——通过数据的分析方法体现对设计流程的理解。与会嘉宾出于各自从业经历,纷纷表示对使用开源工具将多个工具集成起来应用的巨大效能表示赞同。


此次活动吸引了 30 余名来自中科院微电子所和北京主要 IC 设计公司的 Fabless IT 社群成员参加。大家从云计算、CAD 技术、IT 运维、信息安全等专业领域,畅谈云时代的 IT/IC 行业热点和产业趋势,并高度评价此次嘉楠科技承办的 Fabless IT 主题活动。


在活动最后,本次活动的主要发起者、Fabless IT 社群负责人张书波总结到:随着集成电路行业成为国家核心基础行业,不断有新 IT 技术被引入 IC 行业。这也为广大 Fabless IT 从业者们提供了时代机遇。张书波倡议大家坚持“共享、互助、钻研、进步”,共同拓展 IT/CAD 影响力,以 IT 技术助力 Fabless 发展,共助中国芯的实现!


2019 年 8 月 23 日 14:144942
用户头像
孙春鹭 InfoQ 编辑

发布了 27 篇内容, 共 89152 次阅读, 收获喜欢 16 次。

关注

评论

发布
暂无评论
发现更多内容

这20道微服务面试题要是不会,offer就与你无缘

犬来八荒

Java 架构 微服务 面试题 Java 面试

javascript 部分数据类型的用法

Isuodut

到底什么是HashMap?

小闫

Java spring 后端 JVM hashmap

如何写好一封邮件?

石云升

职场 职场成长 邮件

Google官方MVP+Dagger2架构详解

小吴选手

架构 架构师 架构是训练营

week 04 总结

Safufu

从 0 到 1 搭建技术中台之推送平台实践:高吞吐、低延迟、多业务隔离的设计与实现

伴鱼技术团队

kafka 缓存 分布式架构 消息推送 push

让你秒懂Spring中Mybatis的花样配置

小谈

Java spring Spring Cloud mybatis Java 面试

原创 | TDD工具集:JUnit、AssertJ和Mockito (二十四)编写测试-内建扩展

编程道与术

Java 编程 TDD 单元测试 JUnit

架构师0期04周总结

我在终点等你

Week4总结

王志祥

极客大学架构师训练营

「NIO系列」——之Reactor模型

小谈

Spring Boot reactor 后端 nio SpringCloud

极客大学架构师训练营 系统架构 第8课 听课总结

John(易筋)

极客时间 系统架构 极客大学 极客大学架构师训练营 系统架构演化

面试官:十亿级数据ES搜索怎么优化?我直接傻了

犬来八荒

Java 面试 大厂

如果是你,年薪80万和阿里P7月薪36K,会怎么选?

犬来八荒

Java 腾讯 面试 阿里 java面试

终于有大佬把TCP/IP协议讲清楚了!面试再也不怂面试官提问了

小闫

jdk JVM Netty buffer TCP/IP

分布式系统架构学习总结(第四周)

~就这样~

计算机操作系统基础(九)---存储管理之段页式存储管理

书旅

php laravel 线程 操作系统 进程

年薪百万架构师推荐的888页Java王者级核心宝典,offer直接来

无予且行

Java 面试必考的 6 个技能,都在这了

架构大数据双料架构师

攻克SpringBoot底层源码后,才发现开发原来这么香

无予且行

Java spring Spring Boot 开发 Java 面试

游戏夜读 | 关卡设计新手必看

game1night

系统架构:学习小结

Tech Guy

极客大学架构师训练营

使用 Flutter 快速实现请假与写周报应用

LeanCloud

flutter 数据 教程 后端开发

被“假”老干妈耍惨了?憨憨腾讯花1624万卖萌,引全网吃瓜!

程序员生活志

腾讯 互联网 大厂

week 04 作业

Safufu

如何构建你自己的 JVM (2) HelloWorld

孤星可

Java JVM 深入理解JVM

架构师0期04周命题作业

我在终点等你

Linux 性能优化实战 笔记-IO篇

程序员老王

七月份最新“美团+字节+腾讯”面试题,测试一下你能走到哪一面?

犬来八荒

Java 面试 java面试 大厂面试 线程’

基于 Flagger 和 Nginx-Ingress 实现金丝雀发布

郭旭东

Kubernetes CI/CD

Leader修炼指“北”:管理路上的大小Boss

Leader修炼指“北”:管理路上的大小Boss

国内首家IC上云企业 嘉楠科技谈如何实现开发成本最小化-InfoQ