ひらがなの“あ”の文字コードは下記のようにutf-8では“e38182”です。
~ $ echo 'あ'|xxd 00000000: e381 820a ....
print('あ'.encode('utf-8'))
とすれば、結果は「b'\xe3\x81\x82'」となりました。
この「b'\xe3\x81\x82'」を用いてif文を書くにはどのように書けば
よいのでしょうか。Unicodeの「'u3042'」ではif文を書き動作しましたが、
utf-8のコードでは“あ”を指定できないのでしょうか。
Unicodeとutf-8の関係はこのページで理解できました。
https://akamist.com/blog/archives/4646
「'u3042'」で指定すればいいんじゃないの?と思われるかもしれませんが
xxdコマンドで文字コードを調べて、その結果でpythonコード中に書いておきたいので
記述する方法はないものかと思い質問しました。
python3
1#!/usr/bin/env python3 2# -*- coding:utf-8 -*- 3 4if 'あ' == '\u3042': # <== 真になる 5 print('u3042','Match') 6else: 7 print('u3042','Unmatch') 8 9if 'あ' == '\xe3\x81\x82': # <== 真にならない 10 print('xe3x81x82','Match') 11else: 12 print('xe3x81x82','Unmatch')
~ $ python3 test.py b'\xe3\x81\x82' -------- u3042 Match xe3x81x82 Unmatch

回答2件
あなたの回答
tips
プレビュー