unicode如何轉GBK字庫制作

資料大小: 0.41 MB

所需積分: 0

下載次數:

用戶評論: 0條評論,查看

上傳日期: 2020-02-27

上 傳 者: tky_com他上傳的所有資料

資料介紹

標簽:字符(85)BMP(23)二進制(282)

UTF-8(8 位元,Universal Character Set/Unicode Transformation Format)是針對 Unicode 的一種可變長度字符編碼。UCS 字符 U+0000 到 U+007F(ASCII)被編碼為字節 0×00 到 0x7F(ASCIⅡ兼容)。這意味著只包含 7 位 ASCIl 字符的文件在 ASCIⅡ和 UTF-8 兩種編碼方式下是一樣的。所有大于 0x007F 的 UCS 字符被編碼為一個有多個字節的串, 每個字節都有標記位集。因此,ASCIl 字節(0x00-0x7F)不可能作為任何其他字符的一部 分。表示非 ASCIl 字符的多字節串的第一個字節總是在 0xC0 到 0XFD 的范圍里,并指出這 個字符包含多少個字節。多字節串的其余字節都在 0x80 到 0xBF 范圍里。這使得重新同步 非常容易,并使編碼無國界,且很少受丟失字節的影響。UTF-8 編碼字符理論上可以最多 到 6 個字節長,然而 16 位 BMP 字符最多只用到 3 字節長,Bigendian UCS-4 字節串的排 列順序是預定的,字節 0xFE 和 OxFF 在 UTF-8 編碼中從未用到。 UTF-8 編碼規則:如果只有一個字節則其最高二進制位為 0;如果是多字節,其第一個 字節從最高位開始,連續的二進制位值為 1 的個數決定了其編碼的字節數,其余各字節均 以 10 開頭。UTF-8 轉換表表示如下:

用戶評論

查看全部 條評論

發表評論請先 , 還沒有賬號?免費注冊

發表評論

用戶評論
技術交流、我要發言! 發表評論可獲取積分! 請遵守相關規定。
上傳電子資料
汤姆影院网站