现场实操破解开发瓶颈,「2023 百度云智大会·智算大会 开发者沙龙」不容错过! 了解详情
写点什么

倪朋飞:最好的学习方式一定是带着问题学习 | AMA 集锦

  • 2019-10-17
  • 本文字数:2676 字

    阅读完需:约 9 分钟

倪朋飞:最好的学习方式一定是带着问题学习 | AMA集锦

极客时间2周年特邀 100 位在产品、架构、测试、运维、人工智能、管理、编程语言、运营等各个领域的专家,在 App 内与用户交流互动。


InfoQ 特别整理了微软资深工程师、Kubernetes 项目维护者倪朋飞与用户的互动和问答集锦,分享给大家。



你好,我是倪朋飞,微软资深工程师,Kubernetes 项目维护者,极客时间专栏作者。今天我来尝试 AMA,大家关于 Linux、云计算、容器相关的问题都可以问我,我会尽我所能逐一回答,希望能和极客时间一起把部落打造为行业内最好的技术交流社区,大家燃起来。


Q1:您好,我在实际部署和实践过程中,多 Pod 间,通过 service 通信出现过一个问题:一个 Pod 提供 restful 接口,另一个 Pod 中的应用频繁请求接口(例如 qps 50)会造成接口短时间内没响应,过一会后(大约 10-30 几 s 左右)又正常有响应了。这个可能是什么原因呢?有什么排查思路吗?


倪朋飞:可以排查一下被调 Pod 的资源使用情况。


Q2:老师您好,您觉得 OpenShift 对于工业 IoT 的运维是一个重要提升吗?但是使用微软的 Azure 平台,是不是一个更好更专业的选择?


倪朋飞:嗯,是的,简化了很多应用的管理和运维。使用云的话就更省事了,杂活累活都已经帮你处理好了,只要关注自己业务就可以。


Q3:老师你好,我想问一下 K8s 社区对与发布已经超过 9 个月的版本还会进行 bugfix 吗?K8s 社区每三个月发一个版本,看 GitHub 上说社区只维护最新的三个版本,也就是说一个版本仅维护 9 个月,但在生产环境中以这么快的速度升级有点不太合理,所以想知道用老点的版本会不会有问题。


倪朋飞:不会修复了,建议适当更新,不一定每个版本都需要升级,但最好使用还在维护中的版本。


Q4:倪老师,能说说运维要对 Shell 和 Python 掌握到什么程度呢?以及老师能否推荐一些学习资料和书籍呢?运维是只需要学 Python 自动化运维方向的知识就行还是也需要学习 Python 爬虫和 Web 呢?


倪朋飞:感觉上都要精通吧。这方面的书籍挺多的,到京东搜两本评价还不错的就可以,不用多,实践+原理吃透。我的理解运维一般不需要爬虫知识,但对系统一定要熟悉。


Q5:腾讯云服务器Linux连接不上smtp.partner.outlook.cn(25)。安全策略已经允许了所有出口规则。Linux 对出口规则是怎么限制管理的呢?


倪朋飞:Linux 内部可以用 iptables 来控制访问,外部可以用云上的安全组控制,可以检查下这两个地方是不是有问题。


Q6:老师,有个问题困惑了我很久,什么情况下使用多线程能提高性能?如果 CPU 的核数比线程数少,并且都是执行的计算操作,感觉不一定可以提高系统性能。如果是单核的话,多线程是不是不能提升性能,反而因为上下文的迁入迁出增加性能开销。


倪朋飞:多线程可以利用多个核心,比如单线程的时候 CPU 最多可以用到 100%,而多线程可以用到 800%(假设 8 核心的话)。很多情况下都可以提升性能,因为线程不总是以 CPU 100%运行。


Q7:用 K8s 管理微服务 Spring Cloud 比如管理 300 个微服务有什么好的工具或建议,以及 Pipeline 这块代码 Deploy 到 K8s 中这种几百个微服务怎么区分


倪朋飞:可以用 Helm 来管理,不同服务用 Helm chart 配置。至于区分,最简单的使用不同的 namespace


Q8:朋飞老师好,我在工作中使用 K8s 时遇到了一个问题请教一下:官方的 client-go 客户端(版本是 1.14.7)调用集群健康检查接口时偶尔会超时失联(频率不定有时几天有时几个星期才出现,每次超时 10 几分钟后才能自动恢复)。主动重启应用后即可立即恢复连接。我尝试过在代码中清空 transport 和强制 dialer 均未能解决掉这个问题。


倪朋飞:应该是个已知问题,可以参考一下:Client should expose a mechanism to close underlying TCP connections


Q9:生产环境,怎么样确认一个 Java Spring Boot 项目的 Xmx Xms XSS 到底怎么设置? 以及用容器的话,资源怎么分配? 有这方面的参考或者思路嘛?


倪朋飞:第一个问题,可以考虑先根据系统内存设置一个估计值,然后再根据历史监控调整。第二个问题,Java 8 已经支持了 Docker,JVM 可以根据容器内存限制调整 JVM 内存分配;旧版本需要把 Xmx 设置到容器启动参数中。


Q10:Java 在容器上性能是不是比 Golang 这些损失多?除了 Docker 还有其他生产级容器可选么?除了 K8s 等容器方案,还有别的有潜力的应用发布方案么?


倪朋飞:1. 没有听说,我的理解他们应该是一样的


2. Containerd 现在已经可以独立使用了


3. K8s 现在是最主流的方案,不差钱的话,OpenShift 也不错


Q11:老师能说一下 Docker 源码的阅读顺序吗?毕竟 Docker 包含好几个二进制程序。


倪朋飞:先整体上把组件和内部模块串起来,看看 Docker、Containerd、runC 是怎么交互的,每个组件内部又都有哪些内部模块,最后再各个模块细看吧。


Q12:老师好,我最近在阅读 Docker 的源码,比较艰难:


第一:代码中错综复杂的调用,阅读起来容易失去信心;


第二:对相关知识点的理解不足,以及里面包含大量第三方库,阅读起来很容易阻塞;


第三:代码都能看懂,但并不知其意义何在,其实就是不知作者这么设计的目的。


针对第一点,我尝试用时序图构建调用关系,目前看来效果还不错,还能看出其每个函数的职责;


第二点,我是没办法,必需要去学习相关知识点内容;


第三点,也是比较麻烦的一点,目前我是去搜索相关文档,甚至是作者在提交此处代码的 commit message。


老师对于阅读源码有什么经验或许建议吗?目前我个人的体验是艰辛且苦涩。


倪朋飞:一般是先用一用,熟悉文档和基本概念,然后再从一个主线(比如 Docker run)开始弄清楚组件之间的调用关系,最后再去看每个组件内部的实现细节。画图的方式不错,画出来所有组件、每个组件内部的模块还有模块之间的交互,再去看细节就不容易迷失。


Q13:倪老师,请问 Golang 的协程主要的优势体现在 CPU 密集型上还是 IO 密集型程序上?怎样理解多核心和用户态协程的关系


倪朋飞:第一个问题,协程的主要优势在于并发处理变得简单了,对 CPU 密集型和 IO 密集型都适用。第二个问题,协程一般都会基于多线程和多进程充分利用多个核心,而同一线程上又可以轻易运行大量协程。




2 年时间,极客时间已经为用户交付了 94 门课程,涵盖产品、架构、测试、运维、人工智能、管理、编程语言、运营等多个领域。9 月「部落」上线后,用户又有了新的思考和讨论的聚集地。欢迎你加入「部落」,和大咖们共同探讨技术问题,和我们一起探索新的学习方式。


相关文章:


《如何迅速分析出系统 CPU 的瓶颈在哪里?》


《如何快速排查线上 Linux 系统故障?| 极客时间》


《如何基于 Kubernetes 构建完整的 DevOps 流水线》


了解更多请搜索:倪朋飞Linux容器


2019-10-17 16:061858

评论

发布
暂无评论
发现更多内容

led显示屏的合理亮度很有必要

Dylan

LED显示屏 全彩LED显示屏 led显示屏厂家

千亿流量并发治理!Alibaba实战Sentinel笔记,为微服务保驾护航

Geek_0c76c3

Java 数据库 开源 程序员 架构

英特尔发力“系统级代工”,为芯片制造带来全新可能

科技之家

行走的Offer收割机!首次公布Java10W字面经,Github访问量破百万

Geek_0c76c3

Java 数据库 开源 程序员 面试题

易观分析互联网+慢病管理生态洞察,助力行业升级

易观分析

医疗

为什么说企业需要实施知识管理?

Baklib

[iOS研习记]聊聊iOS中的Mach-O

珲少

微服务框架搭建过五关斩六将—第一关(网关)

为自己带盐

微服务 网关 9月月更

架构---作业1

李某人

架构实战营

一文读懂“云游戏”

Finovy Cloud

人工智能 云渲染 云游戏

存储资源盘活系统,“盘活”物联网架构难题(上)

天翼云开发者社区

架构三原则学习心得

Jack

架构 #架构训练营

易观分析对《上海市促进人工智能产业发展条例》的解读

易观分析

人工智能 上海

如何使用iMazing监督、配置器功能

淋雨

ios iphone

计算机网络——点对点协议PPP

StackOverflow

编程 计算机网络 9月月更

【redis】Redis cluster是AP架构还是CP架构?

非晓为骁

redis 分布式架构 redis cluster 分布式理论

企业知识管理怎样做?一些解决方案分享!

Baklib

荣耀开发者平台全面升级,加强分发场景服务与能力开放

荣耀开发者服务平台

开发者 手机 安卓 荣耀 honor

Netty高性能之Reactor模型

C++后台开发

后台开发 reactor 多线程 网络io模型 C++开发

数据中台与数据平台有什么区别?

雨果

数据中台 数据平台

健康信息化不断建设——2022年8月互联网医疗月度观察

易观分析

医疗

知识经济时代的基石:知识协同

Baklib

SaaS时代,您的企业与团队需要知识管理工具

Baklib

聊一聊新陈代谢

Taylor

创新 新陈代谢

Jmix 中 REST API 的两种实现

世开 Coding

Java Spring Boot Jmix 少代码 企业级开发

西部省份数字化需求暴涨 首届828 B2B企业节见证企业数字化新浪潮

科技热闻

如何查询已经执行过的流程信息?

江南一点雨

springboot workflow flowable

计算机网络——媒体接入控制的基本概念

StackOverflow

编程 计算机网络 9月月更

AX200NGW//2×2.4GHz 2x5GHz MT7915 MT7975 //AR9582 2x 2 900M 802.11an//network card//wallys

wallys-wifi6

MT7915 AX200NGW AR9223

分布式系统中自适应统计信息收集策略

KaiwuDB

区块链商城dapp系统开发,代币模式定制

开发微hkkf5566

倪朋飞:最好的学习方式一定是带着问题学习 | AMA集锦_语言 & 开发_倪朋飞_InfoQ精选文章