那些主流編程語言的知識:C 語言(一)
摘要:我們直接使用如下的gcc命令對其進行編譯,而且不帶任何參數,此時將生成一個名爲out.a的可執行文件,通過 ./a.out 能夠輸出“hello world”。然後再通過下面第三行命令來編譯hello.c源文件,編譯完後它會自動與name.o和adder.o兩個目標文件進行連接。
前言
對於編程語言來說,經常看到有因爲各自支持的語言陣營而互懟的,其實根本沒那個必要,都只是一種工具而已。當多數主流語言都會使用時也許你就不會有偏見了,本質不過都是用來描述計算機的一個任務,只是每門語言設計時考慮的側重點不一樣而已。大家最好不要停留在語言層面去爭執,不如把時間花在計算機實現原理和結構的本質上,這樣更能理解編程語言每一行描述的東西在計算機是幹什麼的。本系列將總結現在IT領域主流的那些編程語言的相關知識。
關於C語言
C語言是最經典的語言,很多其他語言的運行環境也是用C來寫的,對於寫程序的人則能不懂C語言呢!提到C首先必然會讓人關聯到指針,當年在大學讓你困惑的指針卻是C語言威力無窮的基礎。C語言可能從更高層面的設計和編寫效率上有所欠缺,但卻足夠經典且容易操控底層。指針雖然風險不小,但卻十分強大。此外ANSI C也增強了C程序在不同操作系統的遷移性,下面列一些C語言的一些基礎知識。
翻譯階段
編寫好的C程序需要先編譯成可執行的機器指令才能運行,這便是翻譯工作。翻譯的主要步驟是編譯和鏈接,編譯就是源代碼到目標代碼,而鏈接是將各個目標文件鏈接起來從而形成一個可執行的程序,當然鏈接器也會引入被程序所用到的所有標準C函數庫的函數。有時編譯過程還會將預處理作爲一個階段,它主要是對源文件進行一些處理,比如將#define替換成實際值、將#include指定的文件內容填充進來。下面是使用gcc來編譯並鏈接的例子,經過編譯和鏈接後得到可執行程序,這兩個步驟通過gcc來完成,命令爲 gcc hello.c -o hello
,最終運行./hello會輸出“hello world”。
#include<stdio.h> int main() { printf("hello world"); }
假如我們編寫了多個c文件,則編譯器會分別編譯成多個obj目標文件,然後再通過鏈接器將所有目標文件鏈接起來生成可執行文件。
關於擴展名
注意windows系統的目標文件擴展名爲obj,一般鏈接完成後也不會被刪除。而unix-like系統的目標文件擴展名爲o,一般在鏈接完成後會被刪除。windows系統的可執行文件擴展名爲exe,而unix-like系統的可執行文件名可以任意命名。此外,C語言源文件一般後綴爲c,而頭文件後綴爲h,雖然沒有強制規定但大家都會去遵守這個約定。
關於編譯器
翻譯階段需要將C語言代碼變爲可執行程序,這些工作由C編譯器完成。C編譯器也有很多,常見的如下:
-
GCC,GCC即(GNU Compiler Collection,GNU編譯器套件),由GNU開發的GPL許可的編譯器自由軟件。剛開始只作爲C語言編譯器,但後來發展成多種語言編譯器,比如C、C++、Java、Android、Objective-C和Fortran等等。現在很多unix-like操作系統自帶GCC,將其作爲標準編譯器。
-
MS C,與微軟的Visual Studio一起集成發佈,由微軟提供的一套完整的集成開發環境,編譯後能在微軟的所有操作系統上運行。比如VS一般會使用CL編譯器。
-
Clang,它是一個基於LLVM的C/C++/Objective-C輕量級編譯器,常用於Mac系統下。
-
Turbo C,這是一個比較流行的C編譯器,小巧快速。
-
cc,即C Compiler,這是一個unix系統古老的編譯器,很多經典書籍會看到這個編譯器。爲保持兼容,現在的linux系統會將cc作爲一個符號連接指向gcc,即/usr/bin/cc -> gcc。
gcc編譯例子
以linux系統的gcc爲例,看幾個編譯例子。假如hello.c的代碼如下,
#include<stdio.h> int main() { printf("hello world"); }
我們直接使用如下的gcc命令對其進行編譯,而且不帶任何參數,此時將生成一個名爲out.a的可執行文件,通過 ./a.out
能夠輸出“hello world”。
gcc hello.c
假如添加name.h/name.c和adder.h/adder.c兩對頭文件和源文件,而且將hello.c稍作修改,三個文件代碼分別如下。
//name.h char* get_name(); //name.c char* get_name() { char* name = "seaboat : "; return name; }
//adder.h int add(int a, int b); //adder.c int add(int a, int b) { return (a + b); }
//hello.c #include <stdio.h> #include <stdlib.h> #include <string.h> #include"adder.h" #include"name.h" int main() { char* name = get_name(); char* hello = "hello world"; char* output = (char*)malloc(strlen(hello) + strlen(name)); sprintf(output, "%s%s", name, hello); printf("%s\n", output); int a = 1; int b = 3; printf("a + b = %d\n", add(a, b)); }
則通過如下的命令可以對多個源文件進行編譯和鏈接,最終生成一個名爲a.out的可執行文件。當我們通過./a.out執行可執行文件時,它將輸出“seaboat : hello world a + b = 4”。
gcc name.c adder.c hello.c
我們還可以通過下面兩個命令對name.c和adder.c兩個文件編譯生成目標文件,分別爲adder.o和name.o。然後再通過下面第三行命令來編譯hello.c源文件,編譯完後它會自動與name.o和adder.o兩個目標文件進行連接。
gcc -c adder.c gcc -c name.c gcc name.o adder.o hello.c
此外,還能夠通過下面的命令來給多個源文件進行編譯並生成各自對應的目標文件,這意味着不對它們進行鏈接。
gcc -c name.c adder.c hello.c
對於多個目標文件,如果要將他們鏈接可以通過下面的命令,便能夠生成可執行文件。
gcc name.o adder.o hello.o
如果我們想對生成的可執行文件進行命名,那麼可以通過下面第一行命令來實現,將生成一個名爲hello的可執行文件。類似地,也可以對多個目標文件進行連接時指定可執行文件名,如下面第二行命令,將生成一個名爲hello2的可執行文件。
gcc name.c adder.c hello.c -o hello gcc name.o adder.o hello.o -o hello2
關於字符集
編寫C語言時源代碼可以包括如下字符集:
-
英語大寫小寫字母
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z
-
十進制的阿拉伯數字
-
其它符號
! " # % & ' () * + , - . / : ; < = > ? [ ] \ ^ _ { } | ~
-
空白符
空格、水平製表符、垂直製表符、換行、換頁
關於註釋
C語言提供的註釋方式有兩種:以 /*
開始而以 */
結束來註釋多行代碼,以 //
開始來註釋單行代碼。一般來說對源碼中進行註釋則意味着編譯時會被預處理器清除掉,用空格來替代。
/* 第一種註釋方式 */ //第二種註釋方式
關於標識符與關鍵詞
標識符就是我們開發人員對變量、函數、類型、結構體、宏等等的起名,C語言也要求我們要按照它的規定來取名。按照規定,標識符可以由英文大小寫字母(A~Z, a z)、阿拉伯數字(0 9)、和下劃線(_)組成。需要注意以下幾點:
-
要求不能以字母開頭。
-
C語言對大小寫字母敏感。
-
C語言不會對標識符的長度進行限制,但標準允許編譯器忽略第31位以後的字符,具體截取前多少位則由不同的編譯器來實現,當截取的字符串相同時則認爲是同一個標識符。
-
標識符不應該亂取名,儘量要讓標識符名字具有相應的意義。
當然C語言還保留了32個特殊的關鍵詞,我們命名的標識符不能與它們相同,否則就會報錯。這32個關鍵詞如下:
關鍵字 | 說明 |
---|---|
auto | 聲明自動變量 |
break | 跳出當前循環 |
case | 開關語句分支 |
char | 聲明字符型變量或函數 |
const | 聲明只讀變量 |
continue | 結束當前循環,開始下一輪循環 |
default | 開關語句中的“默認”分支 |
do | 循環語句的循環體 |
double | 聲明雙精度變量或函數 |
else | 條件語句否定分支(與if連用) |
enum | 聲明枚舉類型 |
extern | 聲明變量或函數是在其它文件中聲明 |
float | 聲明浮點型變量或函數 |
for | 一種循環語句 |
goto | 無條件跳轉語句 |
if | 條件語句 |
int | 聲明整型變量或函數 |
long | 聲明長整型變量或函數 |
register | 聲明寄存器變量 |
return | 子程序返回語句(可以帶參數,也可不帶參數) |
short | 聲明短整型變量或函數 |
signed | 聲明有符號類型變量或函數 |
sizeof | 計算數據類型或變量長度(所佔字節數) |
static | 聲明靜態變量 |
struct | 聲明結構體變量或函數 |
switch | 用於開關語句 |
typedef | 用以給數據類型取別名 |
unsigned | 聲明無符號類型變量或函數 |
union | 聲明共用體類型 |
void | 聲明函數無返回值或無參數,聲明無類型指針 |
volatile | 說明變量在程序執行中可被隱含地改變 |
while | 循環語句的循環條件 |
本公衆號專注於人工智能、讀書與感想、聊聊數學、計算機科學、分佈式、機器學習、深度學習、自然語言處理、算法與數據結構、Java深度、Tomcat內核等。
作者簡介:筆名seaboat,擅長人工智能、計算機科學、數學原理、基礎算法。出版書籍:《Tomcat內核設計剖析》、《圖解數據結構與算法》、《人工智能原理科普》。