2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

怎样 Hack Linux 的内核符号?

  • 2020-08-13
  • 本文字数:2726 字

    阅读完需:约 9 分钟

怎样Hack Linux的内核符号?

Linux 内核是不是坚不可摧?答案是 NO!尽管内核中存在诸多限制,但你只需要稍微花点心思,也可以想办法突破它们。下面我们将通过一个例子来展示这趟有趣的旅程。


首先简单介绍一下项目的背景。客户提供了一批嵌入式智能设备给我们,希望能够检测并且修复其中的安全漏洞。我们能够从设备中接触到二进制形式的固件,但却接触不到固件的源码。对于二进制固件的漏扫和加固是一个行业难题。此外为了减少人工成本,客户还希望我们提供一个自动化的漏扫和加固解决方案,这无疑成为了一件不可能完成的任务。


所谓固件,其实就是一个嵌入式操作系统,常见的有定制化的 Linux 和安卓系统。本质上它们都具有相似的结构:Bootloader、Kernel、根文件系统等。根文件系统中又包含了众多用户态程序、脚本、配置等。对于 Kernel 的 CVE 漏洞自动化扫描和修复是我们当前工作的主要内容。而自动化漏扫技术又可单独成文,本文将主要介绍自动化漏洞修复所用到的内核符号 Hack 技术。


所谓内核漏洞,其实就是 Linux 内核中存在的缺陷函数。所谓漏洞利用,就是在用户态通过一系列精巧的传参和调用,最终触发内核缺陷的过程。这里存在两种修复方式:


1)在触发缺陷的必由调用路径上设卡,做参数或调用关系过滤。比如 c 函数是缺陷函数,该漏洞触发的调用关系是 Func a-> Func b-> Func c,那么可以在 a 或 b 函数上做传参检查,一旦参数非法则立刻退出。这种方式的优点是修复过程简单,尤其当 c 函数调用非常深的时候,可以在表层易于打桩的函数中做传参检查;缺点是需要开发者深入理解漏洞的利用原理,同时不同漏洞的利用方式各不相同,修复方式也各异。


2)用与 c 函数功能相同,并且已经打好补丁的 c‘函数替换掉 c 函数。修补时只需要保证每次对 c 函数的调用都会无条件进入到 c’即可。这种方式的优点是修复方法统一,便于自动化,可不必深究不同漏洞的利用原理。


图示展示了方案二技术架构图:中间是 Hook 框架,提供缺陷函数拦截、函数跳板(Trampoline)、修复函数注册、内核代码区修改等基础功能;右侧是包含具体 CVE 漏洞修复业务的模块。 这里有很多核心问题需要解决,其中之一是修复函数使用未导出内核符号问题。



方案二技术架构图


我们都知道 Linux 是宏内核架构(Monolithic Kernel)。为了实现内核功能的动态扩展,Linux 又引入了内核模块。内核模块将不可避免的使用内核函数。正常情况下,Linux 内核代码会将一些基础功能性函数导出。如控制台输出函数 printk 等。所有被导出的函数都会通过 export_symbols 族的宏修饰。最后这些符号会被内核编译到特殊的段中。而针对我们漏洞修复的场景,内核缺陷函数可能存在于内核的任何地方,因此如果仅仅使用内核导出的少量符号,很多缺陷函数或其依赖函数将无法被解析到。


于是我们把目光放到了内核的 Kallsyms 功能上。这个功能是内核为了方便调试而引入的。当内核发生错误时会输出一系列 Stacktrace,后者其实是一系列函数地址。有了 Kallsyms,在输出 Stacktrace 的时候内核可以把地址解析成函数名输出,告诉开发人员错误发生在哪个函数的哪个位置:



export 导出的 printk 函数/kernel 的 stacktrace


由于内核错误可能发生在任何地方,因此 Kallsyms 单独保存了一份函数符号和函数地址的对应关系,其中的符号数量远远多于 export_symbols 宏导出的符号量。即使内核开启了地址随机化(Address Space Layout Randomization)功能,Kallsyms 也能在运行时解析到符号正确地址。如果在内核模块中想使用未导出的符号,可以使用 Kallsyms 提供的 kallsyms_lookup_name 函数将符号名解析到函数地址,再以函数指针的形式调用即可,如:



Kallsyms


普通需求到这里就完事了,但是针对客户的特殊场景,稍微思考一下就会发现有很大缺陷。假如修复补丁中一共涉及到了数百个未导出的函数,我们则要在修复代码中把所有使用到这些函数的地方全部修改成函数指针调用的形式,工作量增加了不少。最简单的解决办法是内核加载修复模块时,单独走 Kallsyms 解析模块符号,而绕过 export_symbols 这个符号子集(前提是不引入新的内核安全风险)。


Linux 内核模块的加载过程其实跟可执行程序加载动态链接库的过程是一样的。举个简单例子,在 printf(“hello world”)中,我们其实并没有实现 printf(由 puts 函数封装而来)。它实际是由 Libc 库实现。当我们运行 HelloWorld 程序的时候,操作系统会解析程序符号,载入依赖的动态链接库(每次加载的基址可能不同),计算重定位符号地址,并把地址填回 HelloWorld 程序中。我们可以通过下图过程来验证:



Linux 内核模块的加载过程


对于 Linux 内核模块而言,它本质上也是动态链接库,因此加载模块时必然存在解析符号地址的函数。于是我们的思路是,动态拦截该函数,重定向到我们的替换函数中,并在替换函数中添加 Kallsyms 查找符号地址的逻辑即可:左图为我们的替换函数,右图为内核原始函数。这样达到的效果是,我们可以在 CVE 修复代码中直接使用诸如 d_absolute_path 这样的未导出函数,而不用做任何函数指针形式的改造,便于漏洞修复过程的自动化。



符号解析替换函数/符号解析原始函数


可能会有同学感兴趣我们是如何实现内核函数拦截的,即如何从 find_symbol_in_section 跳转到 hook_find_symbol_in_section,这里以 ARM64 架构 CPU 为例简单说明。我们在内核的 find_symbol_in_section 函数开头插入了下图所示的汇编指令(以二进制形式修改内核代码区)。这里借用了 x0 寄存器作远距离跳转(从内核跳转到内核模块)。由于无条件跳转不应该产生任何副作用(即栈帧和寄存器不能改变),因此我们需要先保存 x0 的值到栈上,远跳转后再恢复 x0 内容。


ldr 指令从.addr(low)和.addr(high)中把跳板函数地址装载进 x0,注意到 ARM64 的地址长度为 64 位,而 ARM64 的指令长度为 32 位,因此跳板函数地址被折成低 32 位和高 32 位。进入跳板函数后先恢复 x0 寄存器值,再做近距离跳转(内核模块内部跳转),注意前图 hook_find_symbol_in_section 函数末尾有一行 HOOK_FUNC_TEMPLATE(find_symbol_in_section),即为宏定义的 find_symbol_in_section 的跳板函数。这样经过连续无条件跳转后,执行流被拦截到我们的 HOOK 函数中。



HOOK 函数


此外顺便多提一下,上述使用 Inline Hook 技术的拦截方式跟 CPU 架构是强相关的,如果想实现 ARM32 或 x86 架构的函数拦截,则需要分别单独实现。


作者介绍


刘涛,5 年 Linux 内核开发经历,熟悉操作系统原理,擅长 C 语言、汇编,热爱底层技术,曾在业余时间独立开发过操作系统。目前是 ThoughtWorks 中国安全团队核心成员。我的个人 github 地址是https://github.com/liutgnu


本文转载自 ThoughtWorks 洞见


原文链接


https://insights.thoughtworks.cn/how-to-hack-linux-kernel-symbols/


2020-08-13 14:051917

评论

发布
暂无评论
发现更多内容

飞算 JavaAI:本地智能分析,零上传保障代码安全,精准生成无缝对接

飞算JavaAI开发助手

Kyutai 开源 TTS 模型;Rokid Glasses :语音 AR 免提导航丨日报

声网

iPaaS 与 API 管理:企业数字化转型的双引擎

谷云科技RestCloud

集成平台 API管理 ipaas

对话式 AI workshop:Voice Agent 全球五城开发实录

声网

http流量镜像

八苦-瞿昙

飞算科技自研 Java AI,让传统开发彻底 “失宠”

飞算JavaAI开发助手

爆款 AI 编程工具深度测评:谁在重新定义开发者的效率边界?

飞算JavaAI开发助手

Datax安装及基本使用

刘大猫

人工智能 数据挖掘 算法 数据分析 DataX

商场广告:LED显示屏如何成为吸睛利器?

Dylan

广告 LED显示屏 全彩LED显示屏 led显示屏厂家 户内led显示屏

为什么越来越多 Airtable 用户开始尝试 NocoBase?

NocoBase

开源 低代码 零代码 开发工具 Airtable

漏洞赏金猎人如何最大化利用VPS:从自动化脚本到高级安全测试

qife122

网络安全 漏洞挖掘

WebGL开发数字孪生项目的流程

北京木奇移动技术有限公司

数字孪生 软件外包公司 webgl开发

在AI时代挖掘真实需求:从某知名代理工具的用户反馈看功能演进

qife122

需求分析 代理工具

1 天精通开发不再是梦

飞算JavaAI开发助手

代码安全零风险,开发加速超预期!飞算 JavaAI 重塑老项目开发模式

飞算JavaAI开发助手

n8n完全指南:从入门到精通的工作流自动化实践

知识浅谈

n8n 自动化、

30 秒锁定黑客攻击:SLS SQL 如何从海量乱序日志中“揪”出攻击源

阿里巴巴云原生

阿里云 云原生 日志服务

AI时代深度思考-Remote Agent新一代软件开发协同范式

AI agent cursor

Cloudflare 日志采集和分析最佳实践

观测云

Cloudflare

StarRocks × Tableau 连接器完整使用指南 | 高效数据分析从连接开始

镜舟科技

数据分析 StarRocks Tableau 可视化数据 交互式分析

开启报名|Nacos3.0 开源开发者沙龙·杭州场 Agent&MCP 专场

阿里巴巴云原生

阿里云 云原生 nacos

车用虚拟化技术:域控融合的必经之路

财见

【HarmonyOS】应用开发拖拽功能详解

GeorgeGcs

平衡之道:企业采用低代码加速数字化转型的风险与规避策略

量贩潮汐·WholesaleTide

CrossOver和虚拟机哪个好用?苹果电脑怎么运行Windows软件?

阿拉灯神丁

pd虚拟机 CrossOver Mac下载 如何在Mac运行win

Spring AI Alibaba 游乐场开放!一站式体验AI 应用开发全流程

阿里巴巴云原生

阿里云 开源 云原生 Spring AI Alibaba

大数据-31 ZooKeeper 内部原理 Leader选举 ZAB协议

武子康

Java 大数据 zookeeper 分布式 注册中心

北京中烟创新科技有限公司:资质与荣誉的双重里程碑(深度解析)

中烟创新

Parallels Desktop对Mac的损害大吗 PD虚拟机怎么设置内存和CPU 运行Parallels玩游戏发热怎么办

阿拉灯神丁

Mac 软件 pd虚拟机 Parallels Desktop Parallels 永久密钥 虚拟机安装

基于 ETL 工具实现人大金仓数据库的数据迁移与整合实操指南

谷云科技RestCloud

数据库 数据迁移 ETL 人大金仓 数据集成工具

在AI时代挖掘新需求:从安全黑名单项目中洞察用户真实诉求

qife122

网络安全 需求分析

怎样Hack Linux的内核符号?_架构_张凯峰_InfoQ精选文章