如何調(diào)用C標準庫的exit函數(shù)詳解
編譯大于運算符
原定的計劃中這一篇應(yīng)當是要講如何編譯if表達式的,但是我發(fā)現(xiàn)沒什么東西可以作為if的test-form的部分的表達式,所以覺得,要不還是先實現(xiàn)一下比較兩個數(shù)字這樣子的功能吧。說干就干,我決定用大于運算符來作為例子——大于運算符就是指>啦。所以,我的目標是要編譯下面這樣的代碼
(> 1 2)
并且比較之后的結(jié)果要放在EAX寄存器中。鑒于現(xiàn)在這門語言還非常地簡陋,沒有布爾類型這樣子的東西,所以在此仿照C語言的處置方式,以數(shù)值0表示邏輯假,其它的值表示邏輯真。所以上面的表達式在編譯成匯編代碼并最終運行后,應(yīng)當可以看到EAX寄存器中的值為0。
為了編譯大于運算符,并且將結(jié)果放入到EAX寄存器中,需要用到新的指令CMP、JG,以及JMP了。我的想法是,先將第一個操作數(shù)放入到EAX寄存器,將第二個操作數(shù)放入到EBX寄存器。然后,使用CMP指令比較這兩個寄存器。如果EAX中的數(shù)值大于EBX,那么就使用JG指令跳到一個MOV指令上,這道MOV會將寄存器EAX的值修改為1;否則,JG不被執(zhí)行,執(zhí)行后續(xù)的一道MOV指令,將數(shù)值0寫入到EAX寄存器,然后使用JMP跳走,避免又執(zhí)行到了剛才的第一道MOV指令。思路還是挺簡單的。
在修改jjcc2之前,還需要在inside-out/aux中對>予以支持,但沒什么特別的,就是往member的參數(shù)中加入>這個符號而已。之后,將jjcc2改為如下的形式
(defun jjcc2 (expr globals)
 "支持兩個數(shù)的四則運算的編譯器"
 (check-type globals hash-table)
 (cond ((eq (first expr) '+)
  `((movl ,(get-operand expr 0) %eax)
  (movl ,(get-operand expr 1) %ebx)
  (addl %ebx %eax)))
 ((eq (first expr) '-)
  `((movl ,(get-operand expr 0) %eax)
  (movl ,(get-operand expr 1) %ebx)
  (subl %ebx %eax)))
 ((eq (first expr) '*)
  ;; 將兩個數(shù)字相乘的結(jié)果放到第二個操作數(shù)所在的寄存器中
  ;; 因為約定了用EAX寄存器作為存放最終結(jié)果給continuation用的寄存器,所以第二個操作數(shù)應(yīng)當為EAX
  `((movl ,(get-operand expr 0) %eax)
  (movl ,(get-operand expr 1) %ebx)
  (imull %ebx %eax)))
 ((eq (first expr) '/)
  `((movl ,(get-operand expr 0) %eax)
  (cltd)
  (movl ,(get-operand expr 1) %ebx)
  (idivl %ebx)))
 ((eq (first expr) 'progn)
  (let ((result '()))
  (dolist (expr (rest expr))
  (setf result (append result (jjcc2 expr globals))))
  result))
 ((eq (first expr) 'setq)
  ;; 編譯賦值語句的方式比較簡單,就是將被賦值的符號視為一個全局變量,然后將eax寄存器中的內(nèi)容移動到這里面去
  ;; TODO: 這里expr的second的結(jié)果必須是一個符號才行
  ;; FIXME: 不知道應(yīng)該賦值什么比較好,先隨便寫個0吧
  (setf (gethash (second expr) globals) 0)
  (values (append (jjcc2 (third expr) globals)
    ;; 為了方便stringify函數(shù)的實現(xiàn),這里直接構(gòu)造出RIP-relative形式的字符串
    `((movl %eax ,(get-operand expr 0))))
   globals))
 ((eq (first expr) '_exit)
  ;; 因為知道_exit只需要一個參數(shù),所以將它的第一個操作數(shù)塞到EDI寄存器里面就可以了
  ;; TODO: 更好的寫法,應(yīng)該是有一個單獨的函數(shù)來處理這種參數(shù)傳遞的事情(以符合calling convention的方式)
  `((movl ,(get-operand expr 0) %edi)
  (movl #x2000001 %eax)
  (syscall)))
 ((eq (first expr) '>)
  ;; 為了可以把比較之后的結(jié)果放入到EAX寄存器中,以我目前不完整的匯編語言知識,可以想到的方法如下
  (let ((label-greater-than (intern (symbol-name (gensym)) :keyword))
  (label-end (intern (symbol-name (gensym)) :keyword)))
  ;; 根據(jù)這篇文章(https://en.wikibooks.org/wiki/X86_Assembly/Control_Flow#Comparison_Instructions)中的說法,大于號左邊的數(shù)字應(yīng)該放在CMP指令的第二個操作數(shù)中,右邊的放在第一個操作數(shù)中
  `((movl ,(get-operand expr 0) %eax)
  (movl ,(get-operand expr 1) %ebx)
  (cmpl %ebx %eax)
  (jg ,label-greater-than)
  (movl $0 %eax)
  (jmp ,label-end)
  ,label-greater-than
  (movl $1 %eax)
  ,label-end)))))
然后便可以在REPL中運行下列代碼了
(let* ((ht (make-hash-table)) (asm (jjcc2 (inside-out '(_exit (> 1 2))) ht))) (stringify asm ht))
輸出的匯編代碼為
.data G809: .long 0 .section __TEXT,__text,regular,pure_instructions .globl _main _main: MOVL $1, %EAX MOVL $2, %EBX CMPL %EBX, %EAX JG G810 MOVL $0, %EAX JMP G811 G810: MOVL $1, %EAX G811: MOVL %EAX, G809(%RIP) MOVL G809(%RIP), %EDI MOVL $33554433, %EAX SYSCALL
編譯鏈接運行后,就可以得到預(yù)期的結(jié)果了。下面開始本文的正文
調(diào)用C標準庫的exit函數(shù)
在上面的介紹中,實現(xiàn)了對大于號(>)的處理,那么對if表達式的編譯也就是信手拈來的事了,不解釋太多。在本篇中,將會講述一下如何產(chǎn)生可以調(diào)用來自于C語言標準庫的exit(3)函數(shù)的匯編代碼。
在Common Lisp中并沒有一個叫做EXIT的內(nèi)置函數(shù),所以如同之前實現(xiàn)的_exit一樣,我會新增一種需要識別的(first expr),即符號exit。為了可以調(diào)用C語言標準庫中的exit函數(shù),需要遵循調(diào)用約定。對于exit這種只有一個參數(shù)的函數(shù)而言,情形比較簡單,只需要跟對_exit一樣處理即可。剛開始,我寫下的代碼是這樣的
(defun jjcc2 (expr globals) ;; 省略不必要的內(nèi)容 (cond ;; 省略不必要的內(nèi)容 ((member (first expr) '(_exit exit)) ;; 暫時以硬編碼的方式識別一個函數(shù)是否來自于C語言的標準庫 `((movl ,(get-operand expr 0) %edi) (call :|_exit|)))))
對(exit 1)進行編譯,會得到如下的代碼
.data .section __TEXT,__text,regular,pure_instructions .globl _main _main: MOVL $1, %EDI CALL _exit
不過這樣的代碼經(jīng)過編譯鏈接之后,一運行就會遇到段錯誤(segmentation fault)。經(jīng)過一番放狗搜索后,才知道原來在macOS上調(diào)用C函數(shù)的時候,需要先將棧對齊到16字節(jié)——我將其理解為將指向棧頂?shù)闹羔槍R到16字節(jié)。于是乎,我將jjcc2修改為如下的形式
(defun jjcc2 (expr globals) ;; 省略不必要的內(nèi)容 (cond ;; 省略不必要的內(nèi)容 ((member (first expr) '(_exit exit)) ;; 暫時以硬編碼的方式識別一個函數(shù)是否來自于C語言的標準庫 `((movl ,(get-operand expr 0) %edi) ;; 據(jù)這篇回答(https://stackoverflow.com/questions/12678230/how-to-print-argv0-in-nasm)所說,在macOS上調(diào)用C語言函數(shù),需要將棧對齊到16位 ;; 假裝要對齊的是棧頂?shù)刂?。因為棧頂?shù)刂肥峭偷刂吩鲩L的,所以只需要將地址的低16位抹掉就可以了 (and ,(format nil "$0x~X" #XFFFFFFF0) %esp) (call :|_exit|)))))
結(jié)果發(fā)現(xiàn)還是不行。最后,實在沒轍了,只好先寫一段簡單的C代碼,然后用gcc -S生成匯編代碼,來看看究竟應(yīng)當如何處理這個棧的對齊要求。一番瞎折騰之后,發(fā)現(xiàn)原來是要處理RSP寄存器而不是ESP寄存器——我也不曉得這是為什么,ESP不就是RSP的低32位而已么。
最后,把jjcc2寫成下面這樣后,終于可以成功編譯(exit 1)了
(defun jjcc2 (expr globals)
 "支持兩個數(shù)的四則運算的編譯器"
 (check-type globals hash-table)
 (cond ((eq (first expr) '+)
   `((movl ,(get-operand expr 0) %eax)
   (movl ,(get-operand expr 1) %ebx)
   (addl %ebx %eax)))
  ((eq (first expr) '-)
   `((movl ,(get-operand expr 0) %eax)
   (movl ,(get-operand expr 1) %ebx)
   (subl %ebx %eax)))
  ((eq (first expr) '*)
   ;; 將兩個數(shù)字相乘的結(jié)果放到第二個操作數(shù)所在的寄存器中
   ;; 因為約定了用EAX寄存器作為存放最終結(jié)果給continuation用的寄存器,所以第二個操作數(shù)應(yīng)當為EAX
   `((movl ,(get-operand expr 0) %eax)
   (movl ,(get-operand expr 1) %ebx)
   (imull %ebx %eax)))
  ((eq (first expr) '/)
   `((movl ,(get-operand expr 0) %eax)
   (cltd)
   (movl ,(get-operand expr 1) %ebx)
   (idivl %ebx)))
  ((eq (first expr) 'progn)
   (let ((result '()))
   (dolist (expr (rest expr))
    (setf result (append result (jjcc2 expr globals))))
   result))
  ((eq (first expr) 'setq)
   ;; 編譯賦值語句的方式比較簡單,就是將被賦值的符號視為一個全局變量,然后將eax寄存器中的內(nèi)容移動到這里面去
   ;; TODO: 這里expr的second的結(jié)果必須是一個符號才行
   ;; FIXME: 不知道應(yīng)該賦值什么比較好,先隨便寫個0吧
   (setf (gethash (second expr) globals) 0)
   (values (append (jjcc2 (third expr) globals)
       ;; 為了方便stringify函數(shù)的實現(xiàn),這里直接構(gòu)造出RIP-relative形式的字符串
       `((movl %eax ,(get-operand expr 0))))
     globals))
  ;; ((eq (first expr) '_exit)
  ;; ;; 因為知道_exit只需要一個參數(shù),所以將它的第一個操作數(shù)塞到EDI寄存器里面就可以了
  ;; ;; TODO: 更好的寫法,應(yīng)該是有一個單獨的函數(shù)來處理這種參數(shù)傳遞的事情(以符合calling convention的方式)
  ;; `((movl ,(get-operand expr 0) %edi)
  ;; (movl #x2000001 %eax)
  ;; (syscall)))
  ((eq (first expr) '>)
   ;; 為了可以把比較之后的結(jié)果放入到EAX寄存器中,以我目前不完整的匯編語言知識,可以想到的方法如下
   (let ((label-greater-than (intern (symbol-name (gensym)) :keyword))
    (label-end (intern (symbol-name (gensym)) :keyword)))
   ;; 根據(jù)這篇文章(https://en.wikibooks.org/wiki/X86_Assembly/Control_Flow#Comparison_Instructions)中的說法,大于號左邊的數(shù)字應(yīng)該放在CMP指令的第二個操作數(shù)中,右邊的放在第一個操作數(shù)中
   `((movl ,(get-operand expr 0) %eax)
    (movl ,(get-operand expr 1) %ebx)
    (cmpl %ebx %eax)
    (jg ,label-greater-than)
    (movl $0 %eax)
    (jmp ,label-end)
    ,label-greater-than
    (movl $1 %eax)
    ,label-end)))
  ((eq (first expr) 'if)
   ;; 假定if語句的測試表達式的結(jié)果也是放在%eax寄存器中的,所以只需要拿%eax寄存器中的值跟0做比較即可(類似于C語言)
   (let ((label-else (intern (symbol-name (gensym)) :keyword))
    (label-end (intern (symbol-name (gensym)) :keyword)))
   (append (jjcc2 (second expr) globals)
     `((cmpl $0 %eax)
      (je ,label-else))
     (jjcc2 (third expr) globals)
     `((jmp ,label-end)
      ,label-else)
     (jjcc2 (fourth expr) globals)
     `(,label-end))))
  ((member (first expr) '(_exit exit))
   ;; 暫時以硬編碼的方式識別一個函數(shù)是否來自于C語言的標準庫
   `((movl ,(get-operand expr 0) %edi)
   ;; 據(jù)這篇回答(https://stackoverflow.com/questions/12678230/how-to-print-argv0-in-nasm)所說,在macOS上調(diào)用C語言函數(shù),需要將棧對齊到16位
   ;; 假裝要對齊的是棧頂?shù)刂?。因為棧頂?shù)刂肥峭偷刂吩鲩L的,所以只需要將地址的低16位抹掉就可以了
   (and ,(format nil "$0x~X" #XFFFFFFFFFFFFFFF0) %rsp)
   (call :|_exit|)))))
生成的匯編代碼如下
.data .section __TEXT,__text,regular,pure_instructions .globl _main _main: MOVL $1, %EDI AND $0xFFFFFFFFFFFFFFF0, %RSP CALL _exit
好了,這個時候我就在想,如果想要支持其它來自C語言標準庫的函數(shù)的話,只要依葫蘆畫瓢就好了,好像還挺簡單的——天真的我如此天真地想著。
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對我們的支持。
上一篇:談?wù)剉ector的特殊性之為什么它不是STL容器
欄 目:C語言
本文標題:如何調(diào)用C標準庫的exit函數(shù)詳解
本文地址:http://www.jygsgssxh.com/a1/Cyuyan/230.html
您可能感興趣的文章
- 04-02c語言函數(shù)調(diào)用后清空內(nèi)存 c語言調(diào)用函數(shù)刪除字符
 - 04-02c語言調(diào)用函數(shù)求fibo C語言調(diào)用函數(shù)求階乘
 - 01-10如何判斷一個數(shù)是否為2的冪次方?若是,并判斷出來是多少次方
 - 01-10如何判斷一個數(shù)是否為4的冪次方?若是,并判斷出來是多少次方
 - 01-10如何查看進程實際的內(nèi)存占用情況詳解
 - 01-10APUE筆記之:進程環(huán)境詳解
 - 01-10如何尋找數(shù)組中的第二大數(shù)
 - 01-10基于Linux系統(tǒng)調(diào)用--getrlimit()與setrlimit()函數(shù)的方法
 - 01-10解析如何在C語言中調(diào)用shell命令的實現(xiàn)方法
 - 01-10如何用C語言去除字符串兩邊的空字符
 


閱讀排行
本欄相關(guān)
- 04-02c語言函數(shù)調(diào)用后清空內(nèi)存 c語言調(diào)用
 - 04-02func函數(shù)+在C語言 func函數(shù)在c語言中
 - 04-02c語言的正則匹配函數(shù) c語言正則表達
 - 04-02c語言用函數(shù)寫分段 用c語言表示分段
 - 04-02c語言中對數(shù)函數(shù)的表達式 c語言中對
 - 04-02c語言編寫函數(shù)冒泡排序 c語言冒泡排
 - 04-02c語言沒有round函數(shù) round c語言
 - 04-02c語言分段函數(shù)怎么求 用c語言求分段
 - 04-02C語言中怎么打出三角函數(shù) c語言中怎
 - 04-02c語言調(diào)用函數(shù)求fibo C語言調(diào)用函數(shù)求
 
隨機閱讀
- 01-10SublimeText編譯C開發(fā)環(huán)境設(shè)置
 - 08-05織夢dedecms什么時候用欄目交叉功能?
 - 04-02jquery與jsp,用jquery
 - 01-10使用C語言求解撲克牌的順子及n個骰子
 - 01-11ajax實現(xiàn)頁面的局部加載
 - 01-10delphi制作wav文件的方法
 - 01-11Mac OSX 打開原生自帶讀寫NTFS功能(圖文
 - 08-05DEDE織夢data目錄下的sessions文件夾有什
 - 01-10C#中split用法實例總結(jié)
 - 08-05dedecms(織夢)副欄目數(shù)量限制代碼修改
 


