64bit_division_in_x86.rst 3.6 KB

1234567891011121314151617181920212223242526272829
  1. 在 IA32 中计算 64 位除法的逆向分析
  2. =======================================
  3. 最近逆向 Haswell 的 MRC 代码的时候发现里面有一段 64 位除法的子程序,虽然稍作分析可以认出它是做 64 位除法的,但是当时还是没搞明白细节。这几天再对它进行了证明,终于搞明白这个算法。
  4. 因为 IA32 中没有 64 位除法运算,所以需要用 32 位的除法模拟。IA32 中可以用两个 32 位寄存器 EDX:EAX 保存一个 64 位的无符号被除数,再用一个 32 位寄存器或内存中的整数保存一个 32 位的无符号除数,然后用 DIV 指令完成除法,如果商可以用 32 位无符号整数表示,那么就将商存在 EAX,余数存在 EDX,从而完成除法,否则则发生除法溢出,触发异常。
  5. 首先考虑简单的情形,如果除数高 32 位都是 0,那么可以直接做除法,为了防止溢出,可以用除数分别除被除数的高低 32 位来计算最后的商。如果除数的高 32 位不小于被除数的高 32 位,那么商就是 0 或者 1,只要再看看低 32 位就行了。最后我们再考虑最复杂的情况,就是被除数高 32 位大于除数高 32 位,并且除数高 32 位不为 0. 以下设被除数位 u,除数为 d,处理器寄存器宽度为 w 位,在 IA32 中 w = 32.
  6. 我逆向的这个算法是这么做的。首先右移被除数和除数,直到除数成为 32 位整数,我们记右移的位数为 s. 移位后就可以进行 32 位除法,设移位后被除数和除数成为 u', d', 得到的商和余数为 q', r', 那么 u' = q'd' + r', 0 <= r' <= d' - 1.
  7. 接下来就是要计算最终的商和 q' 的关系了。从反汇编的代码看,商是 q' 或者 (q' - 1),我们首先证明这个性质。
  8. 因为 u / d < (u' + 1) / d' = q' + (r' + 1) / d' <= q' + 1, 所以 u / d 的商小于 q' + 1,即商不大于 q'.
  9. 另一方面,u - (q' - 1)d >= d + u - q'd = d + u - q'(d'(2^s) + LO_s(d)) >= d - q'LO_s(d)
  10. 这里 2^s 指 2 的 s 次方,一个数乘 2^s 相当于它左移 s 位. LO_s(d) 指 d 的最低 s 位。
  11. 由于 q' <= u' / d' = (u >> s) / d' < (2^(2w-s)) / (2^(w-1)) = 2^(w-s+1), LO_s(d) < 2^s, 从而 q'LO_s(d) < 2^(w+1)
  12. 如果 d >= 2^(w+1), 则 u - (q'-1)d >= 0, 如果 d < 2^(w+1), 由此前的假设,d > 2^w, 从而 d 是个 w+1 位的数,s = 1, 从而 LO_s(d) <= 1, q'LO_s(d) <= q' < 2^w, 从而 d - q'LO_s(d) > 0. 总之,u - (q'-1)d >= 0 成立,因此 u/d >= q'-1, 即 u/d 的商不小于 q'-1.
  13. 于是我们证明了 u / d 的商是 q' 或 (q' - 1). 那么剩下的工作是要计算商是哪个值,为此我们计算 u - q'd 来看它是否不小于 0,如果小于 0,则商为 q'-1,否则商为 q'.
  14. u - q'd = u - q'(d'(2^s) + LO_s(d)) = u - (u'-r')(2^s) - q'LO_s(d) = LO_s(u) + r'(2^s) - q'LO_s(d)
  15. 这个值不好算,因为提取 u 和 d 的低 s 位有点麻烦,但是如果把一个数左移 (w-s) 位,那么这个数的低 s 位就可以顶到 w 位整数的最高位,高位的数都在左移的过程中丢弃。根据反汇编的代码,我们计算 (r'(2^s) - q'LO_s(d)) << (w-s) = r'(2^w) - q'(d<<(w-s)), 设 q'(d<<(w-s)) = t, HI_w(t) 和 LO_w(t) 为 t 的高 w 位和低 w 位,而 HI_w(r'(2^w)) 恰好就是 r'.
  16. 如果 r' > HI_w(t), 那么 (r'(2^s) - q'LO_s(d)) << (w-s) 大于 0, 从而 r'(2^s) - q'LO_s(d) > 0, u - q'd > 0.
  17. 如果 r' < HI_w(t), 则 t - r'(2^w) >= 2^w, 而 (LO_s(u) << (w-s)) < 2^w, 从而 ((u - q'd) << (w-s)) = ((LO_s(u) << (w-s)) + r'(2^w) - t) <= -(2^w - (LO_s(u) << (w-s))) < 0, 所以 u - q'd < 0.
  18. 如果 r' = HI_w(t), 则 ((u - q'd) << (w - s)) = (LO_s(u) << (w - s)) - LO_w(t) = LO_w(u << (w - s)) - LO_w(t). 只要比较 LO_w(u << (w-s)) 和 LO_w(t) 即可。