大咖直播-鸿蒙原生开发与智能提效实战!>>> 了解详情
写点什么

倪朋飞:最好的学习方式一定是带着问题学习 | AMA 集锦

  • 2019-10-17
  • 本文字数:2676 字

    阅读完需:约 9 分钟

倪朋飞:最好的学习方式一定是带着问题学习 | AMA集锦

极客时间2周年特邀 100 位在产品、架构、测试、运维、人工智能、管理、编程语言、运营等各个领域的专家,在 App 内与用户交流互动。


InfoQ 特别整理了微软资深工程师、Kubernetes 项目维护者倪朋飞与用户的互动和问答集锦,分享给大家。



你好,我是倪朋飞,微软资深工程师,Kubernetes 项目维护者,极客时间专栏作者。今天我来尝试 AMA,大家关于 Linux、云计算、容器相关的问题都可以问我,我会尽我所能逐一回答,希望能和极客时间一起把部落打造为行业内最好的技术交流社区,大家燃起来。


Q1:您好,我在实际部署和实践过程中,多 Pod 间,通过 service 通信出现过一个问题:一个 Pod 提供 restful 接口,另一个 Pod 中的应用频繁请求接口(例如 qps 50)会造成接口短时间内没响应,过一会后(大约 10-30 几 s 左右)又正常有响应了。这个可能是什么原因呢?有什么排查思路吗?


倪朋飞:可以排查一下被调 Pod 的资源使用情况。


Q2:老师您好,您觉得 OpenShift 对于工业 IoT 的运维是一个重要提升吗?但是使用微软的 Azure 平台,是不是一个更好更专业的选择?


倪朋飞:嗯,是的,简化了很多应用的管理和运维。使用云的话就更省事了,杂活累活都已经帮你处理好了,只要关注自己业务就可以。


Q3:老师你好,我想问一下 K8s 社区对与发布已经超过 9 个月的版本还会进行 bugfix 吗?K8s 社区每三个月发一个版本,看 GitHub 上说社区只维护最新的三个版本,也就是说一个版本仅维护 9 个月,但在生产环境中以这么快的速度升级有点不太合理,所以想知道用老点的版本会不会有问题。


倪朋飞:不会修复了,建议适当更新,不一定每个版本都需要升级,但最好使用还在维护中的版本。


Q4:倪老师,能说说运维要对 Shell 和 Python 掌握到什么程度呢?以及老师能否推荐一些学习资料和书籍呢?运维是只需要学 Python 自动化运维方向的知识就行还是也需要学习 Python 爬虫和 Web 呢?


倪朋飞:感觉上都要精通吧。这方面的书籍挺多的,到京东搜两本评价还不错的就可以,不用多,实践+原理吃透。我的理解运维一般不需要爬虫知识,但对系统一定要熟悉。


Q5:腾讯云服务器Linux连接不上smtp.partner.outlook.cn(25)。安全策略已经允许了所有出口规则。Linux 对出口规则是怎么限制管理的呢?


倪朋飞:Linux 内部可以用 iptables 来控制访问,外部可以用云上的安全组控制,可以检查下这两个地方是不是有问题。


Q6:老师,有个问题困惑了我很久,什么情况下使用多线程能提高性能?如果 CPU 的核数比线程数少,并且都是执行的计算操作,感觉不一定可以提高系统性能。如果是单核的话,多线程是不是不能提升性能,反而因为上下文的迁入迁出增加性能开销。


倪朋飞:多线程可以利用多个核心,比如单线程的时候 CPU 最多可以用到 100%,而多线程可以用到 800%(假设 8 核心的话)。很多情况下都可以提升性能,因为线程不总是以 CPU 100%运行。


Q7:用 K8s 管理微服务 Spring Cloud 比如管理 300 个微服务有什么好的工具或建议,以及 Pipeline 这块代码 Deploy 到 K8s 中这种几百个微服务怎么区分


倪朋飞:可以用 Helm 来管理,不同服务用 Helm chart 配置。至于区分,最简单的使用不同的 namespace


Q8:朋飞老师好,我在工作中使用 K8s 时遇到了一个问题请教一下:官方的 client-go 客户端(版本是 1.14.7)调用集群健康检查接口时偶尔会超时失联(频率不定有时几天有时几个星期才出现,每次超时 10 几分钟后才能自动恢复)。主动重启应用后即可立即恢复连接。我尝试过在代码中清空 transport 和强制 dialer 均未能解决掉这个问题。


倪朋飞:应该是个已知问题,可以参考一下:Client should expose a mechanism to close underlying TCP connections


Q9:生产环境,怎么样确认一个 Java Spring Boot 项目的 Xmx Xms XSS 到底怎么设置? 以及用容器的话,资源怎么分配? 有这方面的参考或者思路嘛?


倪朋飞:第一个问题,可以考虑先根据系统内存设置一个估计值,然后再根据历史监控调整。第二个问题,Java 8 已经支持了 Docker,JVM 可以根据容器内存限制调整 JVM 内存分配;旧版本需要把 Xmx 设置到容器启动参数中。


Q10:Java 在容器上性能是不是比 Golang 这些损失多?除了 Docker 还有其他生产级容器可选么?除了 K8s 等容器方案,还有别的有潜力的应用发布方案么?


倪朋飞:1. 没有听说,我的理解他们应该是一样的


2. Containerd 现在已经可以独立使用了


3. K8s 现在是最主流的方案,不差钱的话,OpenShift 也不错


Q11:老师能说一下 Docker 源码的阅读顺序吗?毕竟 Docker 包含好几个二进制程序。


倪朋飞:先整体上把组件和内部模块串起来,看看 Docker、Containerd、runC 是怎么交互的,每个组件内部又都有哪些内部模块,最后再各个模块细看吧。


Q12:老师好,我最近在阅读 Docker 的源码,比较艰难:


第一:代码中错综复杂的调用,阅读起来容易失去信心;


第二:对相关知识点的理解不足,以及里面包含大量第三方库,阅读起来很容易阻塞;


第三:代码都能看懂,但并不知其意义何在,其实就是不知作者这么设计的目的。


针对第一点,我尝试用时序图构建调用关系,目前看来效果还不错,还能看出其每个函数的职责;


第二点,我是没办法,必需要去学习相关知识点内容;


第三点,也是比较麻烦的一点,目前我是去搜索相关文档,甚至是作者在提交此处代码的 commit message。


老师对于阅读源码有什么经验或许建议吗?目前我个人的体验是艰辛且苦涩。


倪朋飞:一般是先用一用,熟悉文档和基本概念,然后再从一个主线(比如 Docker run)开始弄清楚组件之间的调用关系,最后再去看每个组件内部的实现细节。画图的方式不错,画出来所有组件、每个组件内部的模块还有模块之间的交互,再去看细节就不容易迷失。


Q13:倪老师,请问 Golang 的协程主要的优势体现在 CPU 密集型上还是 IO 密集型程序上?怎样理解多核心和用户态协程的关系


倪朋飞:第一个问题,协程的主要优势在于并发处理变得简单了,对 CPU 密集型和 IO 密集型都适用。第二个问题,协程一般都会基于多线程和多进程充分利用多个核心,而同一线程上又可以轻易运行大量协程。




2 年时间,极客时间已经为用户交付了 94 门课程,涵盖产品、架构、测试、运维、人工智能、管理、编程语言、运营等多个领域。9 月「部落」上线后,用户又有了新的思考和讨论的聚集地。欢迎你加入「部落」,和大咖们共同探讨技术问题,和我们一起探索新的学习方式。


相关文章:


《如何迅速分析出系统 CPU 的瓶颈在哪里?》


《如何快速排查线上 Linux 系统故障?| 极客时间》


《如何基于 Kubernetes 构建完整的 DevOps 流水线》


了解更多请搜索:倪朋飞Linux容器


2019-10-17 16:062209

评论

发布
暂无评论
发现更多内容

技术分享| 如何做一款容纳百人的视频会议?

anyRTC开发者

音视频 WebRTC 视频会议 实时通信 视频通话

许式伟:Go+ Together丨Go+ 1.0 发布会干货分享

七牛云

Go 语言

黄东旭:写给后端程序员看的认知心理学丨Go+ 1.0 发布会干货分享

七牛云

Go 语言

干货分享:细说双 11 直播背后的压测保障技术

阿里巴巴中间件

阿里云 云原生 中间件 全链路 PTS

明道云商业化成果巡礼|2021年11月

明道云

Go iota 原理和源码剖析

编程宝库

构建 Snowpack + React + Typescript + Electron的Desktop App

吴脑的键客

typescript Electron React webpack

网易云信发布虚拟形象实时互动融合 SDK ,元宇宙大幕即将开启

网易云信

人工智能 数字化 元宇宙

HarmonyOS 3.0.0开发者预览版全新发布

HarmonyOS开发者

HarmonyOS ArKUI 3.0 ArkCompiler 3.0

视野 | OpenSearch,云厂商的新选择?

RadonDB

数据库 搜索引擎; Elastic Search

无处不在的 Kubernetes,难用的问题解决了吗?

阿里巴巴中间件

阿里云 Kubernetes 容器 云原生 中间件

拒绝编译等待 - 动态研发模式 ARK

字节跳动终端技术

ios 字节跳动 移动开发

Go+ Together!Go+ 1.0 发布会暨 Go+ 开发者基金会启动仪式圆满结束!

七牛云

Go 语言

频繁更新主机,导致pod ip不够解决方法

ilinux

【堡垒机小知识】堡垒机是硬件还是软件?

行云管家

网络安全 信息安全 数据安全 堡垒机

🏆【Alibaba中间件技术系列】「RocketMQ技术专题」小白专区之领略一下RocketMQ基础之最!

码界西柚

RocketMQ 消息队列 Alibaba技术 11月日更

多变的智能降噪

睿象云

运维 告警 智能运维 告警管理

iOS开发面试和底层学习视频整理合集

iOSer

ios iOS面试 ios开发 iOS视频学习 iOS涨薪

【高并发】通过源码深度分析线程池中Worker线程的执行流程

冰河

Java 并发编程 多线程 高并发 异步编程

一个站点不够学?那就在用Python增加一个采集目标,一派话题广场+某金融论坛话题广场爬虫

梦想橡皮擦

11月日更

阿里IM技术分享(六):闲鱼亿级IM消息系统的离线推送到达率优化

JackJiang

架构设计 即时通讯 IM

程序员的硬核浪漫 — 女友专属语聊房(内附源码)

ZEGO即构

音视频 语聊房 demo源码 即构科技

恒源云(GPUSHARE)_基于梯度的NLP对抗攻击方法

恒源云

人工智能 深度学习

Microsoft SQL Server 迁移利器,Babelfish for Aurora PostgreSQL 上线!

亚马逊云科技 (Amazon Web Services)

数据库 开源 源代码

vue3 学习笔记 (一)——mixin 混入

码仔

Vue3 mixin

林昊:开发者如何提升写代码的硬实力丨Go+ 1.0 发布会干货分享

七牛云

Go 语言

许式伟:Go+ v1.x 的设计与实现丨Go+ 公开课 • 第一期

七牛云

Go 语言 goplus

巅峰对话在线研讨 Q&A:Oracle Database 21c vs openGauss 2.0新特性解读和架构演进

墨天轮

数据库 oracle opengauss

北省廊坊市本地有等保测评机构吗?在哪里?

行云管家

网络安全 等保 等级保护 等保测评 廊坊

原因揭秘!为什么选择 Pulsar 而非 Kafka

Apache Pulsar

kafka 开源 架构 分布式 Apache Pulsar

参会指南 | 2021MongoDB南京技术沙龙

MongoDB中文社区

mongodb

倪朋飞:最好的学习方式一定是带着问题学习 | AMA集锦_语言 & 开发_倪朋飞_InfoQ精选文章