国产成人AV无码一二三区,少女1到100集,国产精品久久久久精品综合紧,巜公妇之诱感肉欲HD在线播放

文章 > Python常见问题 > unicode与utf-8的对比

unicode与utf-8的对比

Python

头像

Python

2019-06-10 16:26:042940浏览 · 0收藏 · 0评论

UTF-8一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。UTF-8的编码规则很简单,只有二条:

1)对于单字节的符号,字节的第一位设为0,后面7位为这个符号的unicode码。因此对于英语字母,UTF-8编码和ASCII码是相同的。

2)对于n字节的符号(n>1),第一个字节的前n位都设为1,第n+1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的unicode码。

下表总结了编码规则,字母x表示可用编码的位。

Unicode符号范围      |        UTF-8编码方式

(十六进制)           |        (二进制)

----------------------+---------------------------------------------

0000 0000-0000 007F | 0xxxxxxx

0000 0080-0000 07FF | 110xxxxx 10xxxxxx

0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx

0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

以汉字“严”为例,演示如何实现UTF-8编码。

已知“严”的unicode是4E25(100111000100101),根据上表,可以发现4E25处在第三行的范围内(0000 0800-0000 FFFF),因此“严”的UTF-8编码需要三个字节,即格式是“1110xxxx 10xxxxxx 10xxxxxx”。然后,从“严”的最后一个二进制位开始,依次从后向前填入格式中的x,多出的位补0。这样就得到了,“严”的UTF-8编码是“11100100 10111000 10100101”,转换成十六进制就是E4B8A5。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

老头跪在两腿之间吃奶| 小寡妇在线观看免费播放电视剧| 男按摩师吸乳房会得乳腺瘟吗| 王叔我老公还在客厅呢什么小说| 女士穿紧身裸体开裆光滑皮裤 | 公交车大肉大捧一进一出好爽 | 高压监狱在线观看免费高清完整| 妈妈叫我戴上避孕套英文| 干爹你真棒插曲免费看| 美国式禁忌5老熟女| 粗大挺进亲女小雅小沈| 双男真人免费观看完整版高清| 妈妈与儿子高清免费版电视剧| 免费网站在线观看大全电视剧| 糖心| 《头等舱》韩国电影在线看| 双乳被四个男人吃奶H文| 坤坤寒进桃子里在线看歌词 | 儿子日娘章节小说| 血战钢锯岭免费完整版在线观看 | 健身教练压腿压进去会怎么样 | 扌澡辶鬲的图片| WWW.MD.GOVCN| 成人做爱免费A片视频| 免费B站看大片真人电视剧| AAA成人片爽久爽久爽| 美丽小洞5荷尔蒙| 18岁的少女与狗高清电视剧| 金瓶第1回双乳被吸| 每日大赛吃瓜爆料每日大赛聚集地| 被门卫大爷日出水小说| XXXX妇女性暴行XXXX| 《酒店激战》动漫1-5集免费观... | .《李瓶儿之真爱无悔》| 白天像教授晚上像野兽| 法国色情巜监狱宝贝3| 电影《满足2》完整版在线观看 | 汁液横流BY笔趣阁| 黑寡妇5免费观看高清| 20厘米能插到肚子吗| INDEX.PHP