pwn入门-整数溢出

发表于2024-11-28|更新于2025-02-26|pwn

|总字数:1k|阅读时长:3分钟|浏览量:|评论数:

pwn入门-整数溢出

原理

整数溢出”漏洞，是计算机在对数值处理(存储、运算、条件判断)过程中，产生了不符合预期理论设计的错误，使得计算机本身行为偏离预期(漏洞)。

譬如，预期的理论设计是1+1=2，但由于不可知的错误(发生在存储、运算时)，导致了1+1=3，程序(软件层面)还依赖于3这个数值(条件判断、运算)，那么计算机的行为，就会偏离预期了。

存储角度

计算机存储一个“整数”，是“模2的偶数次幂”的原理。负数的编码上，也只是一个移码，它只是把整个“负数集合”，从左往右挪(移)，假设左边是负数，右边是整数。至于补码，其实就是加了一个“轮回”(2的偶数次幂)。至于，浮点数的存储原理，和整数非常不同。

浮点数，主要是涉及一个“无论多少位都无法精确表达”的问题，就是IEEE754中，浮点数设计的缺陷。在十进制中，唯有尾数是0或5的小数，才可以理论上被精确表示。

浮点数，用一个三元组表示 {Sign, Exponent, Significance}。其中，指数位(Exponent)，主要是一个移码的设计。当指数位为全0的时候，可以表示十进制数0。当指数位全1的时候，可以表示正/负无穷。此上述两者为特殊数值，故去掉后，码位减少了2个位置。在减少两个位置的情况下，将正数、负数，“均等”地编码在这些码位上，则移码的偏移量为127。如果指数是3，则机器存储，为3+127=130；负数同理，亦是加上127，再进行机器存储。这个移码设计，保证了存储上，正数大于负数。

运算角度

如果连浮点数都能轻易理解，那么理解整数，整数上的模2群运算，应该不成问题。顶多涉及一些编码(负数挪位置)的问题。

显然，一个数(无符号数)，加着加着，或者减着减着，或者去做乘法，它有可能溢出，跑到负数的编码位置上。如果程序设计不好，将这个“不符合预期理论设计”得出的数，当作一个有符号数(负数)进行处理，那肯定出问题。

条件判断角度

这个涉及X86的汇编，就是OF标志位和SF标志位。OF标志位，只对无符号数有意义，因为，正数加正数，不会出现一个负数(符号位为1)；负数加负数，不会出现一个正数(符号位为0)。

至于，SF，就更简单了，记录了运算结果的符号位。SF，运算结果是正数，就是0；运算结果是负数，就是1。X86的计算机，根据这两个标志位，就可以进行有符号数、无符号数的大小判断了。

现实(In practice)

现实中，上面三个，导致“整数溢出”漏洞的诱因，往往综合起来出现。

举个例子，譬如，体现在一个函数(功能)上：有一个函数(如atoi、strlen函数等)，对输入的字符进行处理，并转化为数值。如果该数值，存储的过程中，被模，“截断了”，那么它导致程序出现非预期行为的概率非常大。如果，后续，还用这个数值做判断，那不就是多个诱因综合出现嘛。

靠人

因为，“整数溢出”漏洞，是跟“预期理想设计”相关的。说白了，就像是人，在做(软件)工程质检：你的预期设计是这样的，但是工程上，这样子处理这些数值，会使计算机出现非预期的行为。那就需要，那个“人”，质检员，对“整数溢出”漏洞，有深入的理解，一定的实践经验。

靠机器、方法论

如何定义，什么是“预期设计”，什么是“非预期设计”，是个难点。

文章作者: Matriy

文章链接: http://matriy330.github.io/7a7a5e50/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Matriy's blog！

赞助

wechat
alipay

相关推荐

GDB基本使用及pwn常用命令

GDB基本使用及pwn常用命令i r查看寄存器 start 运行程序，停在 main 函数的第一行。 run 从程序的入口点开始执行，并会一直运行，直到.程序正常结束。 b main ,b *(0xdsds)设置断点 i b查看断点，d main删除断电，disable b 2，让断点失效。enable b 3 si会进入xx方法实现的里面 ni是下一步。finish步出 c继续显示从地址0x100开始的10个十六进制数：x/10x 0x100 显示从寄存器$rax开始的4个无符号十进制数：x/4uw $rax 显示字符数组str的内容，直到遇到’\0’结束：x/s str x/20g $rbp-0x20：这个命令表示从地址$rbp-0x20开始，以十六进制格式打印20个g大小的内存单元。这里的g通常代表8字节（64位）的巨量（giant word）。所以它会打印20个8字节的值，总共160字节的数据。这种格式通常用于查看较大数值或指针地址（在64位系统上指针也是8字节）。 x/20b...

pwn入门-ELF文件概述程序装载与虚拟内存

pwn入门-ELF文件概述程序装载与虚拟内存参考程序加载 - CTF Wiki和https://www.bilibili.com/video/BV1Uv411j7fr?spm_id_from=333.788.videopod.episodes&vd_source=d76ad0aadca055336653cd966075f064&p=3 pwn概述exploit：用于攻击的脚本与方案 payload：攻击载荷，是的目标进程被劫持控制流的数据 shellcode：调用攻击目标的she的代码攻击流程： C语言执行流程C语言代码到可执行文件流程：目标文件未经过链接，虽然知道自己任务但是不知道如何去做，比如put为何就是输入，需要将多个机器码目标文件链接成一个可执行文件广义:文件中的数据是可执行代码的文件.out、.exe、.sh、.py 狭义:文件中的数据是机器码的文件.out、.exe、.dll、.so Windows:PE(Portable...

pwn入门-canary&PIE bypass

pwn入门-canary&PIE bypass 主函数没有get shel怎么办?(ret2text) 整个程序没有system函数怎么办?(ret2libc)64位程序就这么简单?(ret2csu) 静态编译怎么办?(ret2syscall) 保护不全有没有好办法?(ret2shellcode) 栈与非栈的格式化字符串 canarycanary:是一种用来防护栈溢出的保护机制。其原理是在一个函数的入口处，先从fs/gs寄存器中取出一个4字节(eax)或者8字节(rax)的值存到栈上，当函数结束时会检查这个栈上的值是否和存进去的值一致 canary保存在tls结构体中。 all和部分是有区别的 all是在所有方法都会加Cancary，部分只会在char那边加 123456789101112131415161718192021222324252627#include <stdio.h>#include <stdlib.h>#include <unistd.h>int func_1(){ char...

pwn入门-ret2shellcode

pwn入门-ret2shellcode先看我的另一篇文章，shellcode详解例一12345678910111213141516#include <stdio.h>#include <stdlib.h>#include <unistd.h>int dofunc(){ char b[0x100]; puts("input:"); read(0,b,0x100); ((void (*) (void)) b)(); return 0;}int main(){ dofunc(); return 0;} NX：栈不可执行 123456789101112131415from pwn import *context(log_level='debug',arch='amd64', os='linux')pwnfile= './question_6_1_x64'io =...

pwn入门-ret2csu+栈对齐

pwn入门-ret2csu+栈对齐没有写system就一定没?除了system还有vmmap mproject orw int 0x80 syscall open read puts exevc malloc_ hook free_hook exit_hook…. 12345678910111213141516#include <stdio.h>#include <stdlib.h>#include <unistd.h>int dofunc(){ char b[8] = {}; write(1,"input:",6); read(0,b,0x100); write(1,"bye",3); return 0;}int main(){ dofunc(); return...

pwn入门-ret2syscall

pwn入门-ret2syscall静态编译怎么办?如果没system怎么办? system封装的execve 1int execve(const char *filename, char *const argv[], char *const...

评论