一個字符不等價於一個字節,字符是人類能夠識別的符號,而這些符號要保存到計算的存儲中就需要用計算機能夠識別的字節來表示。一個字符往往有多種表示方法,不同的表示方法會使用不同的字節數。這裏所說的不同的表示方法就是指字符編碼,比如字母A-Z都可以用ASCII碼錶示(佔用一個字節),也可以用UNICODE表示(佔兩個字節),還可以用UTF-8表示(佔用一個字節)。字符編碼的作用就是將人類可識別的字符轉換爲機器可識別的字節碼,以及反向過程。

UNICDOE纔是真正的字符串,而用ASCII、UTF-8、GBK等字符編碼表示的是字節串。關於這點,我們可以在Python的官方文檔中經常可以看到這樣的描述"Unicode string" , " translating a Unicode string into a sequence of bytes"

Python字符串格式化

Python 支持格式化字符串的輸出 。儘管這樣可能會用到非常複雜的表達式,但最基本的用法是將一個值插入到一個有字符串格式符 %s 的字符串中。

在 Python 中,字符串格式化使用與 C 中 sprintf 函數一樣的語法。

字符串中的字符定位

字符串本質上就是單個字符組在的一個列表,可通過S[x]運算符指代相應字符,x標註在字符之前的位置,類似於打字的光標,代表該位置後的一個字符。第一個位置爲0,S[0]表示字符'A'。[x:y]表示x和y兩個位置之間的字符,[x:]和[:y]分別表示“”x位置之後的所有字符”和“y位置之前的所有字符”。如:[:6]表示第7個字符之前的所有字符(即:'ABCD_1')。

字符串對象提供了find('指定字符')和rfind('指定字符')兩種方法,分別從頭或從尾開始計算,返回所指定字符的下標位置,返回int類型數值。

“我們相信人人都可以成爲一個IT大神,現在開始,選擇一條陽光大道,助你入門,學習的路上不再迷茫。這裏是北京尚學堂,初學者轉行到IT行業的聚集地。"

查看原文 >>
相關文章