質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 2.7

Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

プログラミング言語

プログラミング言語はパソコン上で実行することができるソースコードを記述する為に扱う言語の総称です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

7842閲覧

【Python】もう嫌!><文字化け・・・

EzrealTrueshot

総合スコア388

Python 2.7

Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

プログラミング言語

プログラミング言語はパソコン上で実行することができるソースコードを記述する為に扱う言語の総称です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2014/12/29 12:53

お世話になっております。Ezです。
現在、Pythonの勉強をしているのですが・・・文字化けがわかりません!
よろしければ教えて頂けないでしょうか?

print type(tmp) ⇒ <type 'unicode'>
print tmp ⇒ あいうえお
ここで、splitを用いると下記のようになるかと思ったのですが

lang

1tmp2 = tmp.split("う") ⇒ ["あい","えお"] 2tmp2 = tmp.split(u"う") ⇒ ["あい","えお"]

なりませんでした!
[u'\u8cb7\u3044','u307e\u3059']こういう意味わからない文字列になります。


また、こういう場合も文字化けエラーが頻繁してしまいます。

self.response.write("{0}{1}".format("テスト",list[1]))

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)

本来なら

lang

1テスト list[1]の中身

という表示結果がほしいのに、エラーで中断されてしまいます。

色々とグーグル先生に聞いてみたのですが、エンコードやデコードしようみたいなこと書かれていたのですが、結局、自分の意図した出力にさせることが出来ませんでした。

解決方法をご存知の方いらっしゃいましたら教えて頂けないでしょうか?
よろしくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

self.response.write("{0}{1}".format("テスト",list[1]))  なんでこれじゃダメなんでしょう;

pythonではUnicode文字列(=u"XXXX")とバイナリ文字列(="")は基本的に別のものです。
list[1]の中身が何なのか不明ですが、UnicodeEncodeErrorが出ているということなので、Unicode文字列なのでしょうね。
違ったコード体系のものをformat関数でtemplate文字列に一緒に流し込もうとしても、当然怒られます。

lang

1self.response.write("{0}{1}".format("テスト",list[1].encode("utf-8")))

などとするのが正しいです。

それから、listオブジェクトの内容をprintする場合はstr()が評価されるようなので、

lang

1for i in listobject 2 print i

lang

1print listobject[0] 2print listobject[1]

などとしてください。
イントロスペクションでstr()を評価させずに、個別に直接評価させれば何もしなくても普通に表示されるはずです。

投稿2014/12/29 16:20

ShinpeiYamamoto

総合スコア540

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

EzrealTrueshot

2014/12/29 16:39

とてもよくわかりました! ありがとうございます。
guest

0

今回で初めて触りましたが、Python では文字列型が2種類もあるのですね、これは混乱しそうです

通常文字列とユニコード文字列と2パターンのプリント処理を調べながら書いてみました

もともとASCII 文字の処理に特化していたとかしていなかったとかで、文字(列)の扱いがこのようになっているそうですね

\u3042 といった直感的には読めない1文字になっていますが、出力時にフォーマットされるみたいですね

lang

1# coding=UTF-8 2class Printer: 3 4 def __init__(self): 5 print '[Printer.__init__]' 6 self.tmp_u = u'あいうえお' 7 self.tmp = 'あいうえお' 8 9 def my_print_a(self): 10 list = self.tmp_u.split(u'う') 11 print(self.tmp_u.split(u'う')) 12 print "{0}{1}".format("テスト",list[1].encode('utf-8')) 13 14 def my_print_b(self): 15 list = self.tmp.split('う') 16 print(self.tmp.split('う')) 17 print "{0}{1}".format("テスト",list[1]) 18 19x = Printer() 20x.my_print_a() 21x.my_print_b() 22# => [Printer.__init__] 23# => [u'\u3042\u3044', u'\u3048\u304a'] 24# => テストえお 25# => ['\xe3\x81\x82\xe3\x81\x84', '\xe3\x81\x88\xe3\x81\x8a'] 26# => テストえお

投稿2014/12/29 16:25

gouf

総合スコア2321

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

EzrealTrueshot

2014/12/29 16:39

回答ありがとうございます! 参考URLも助かります!
ShinpeiYamamoto

2014/12/29 16:42

> Python では文字列型が2種類もあるのですね、これは混乱しそうです 喧嘩をするつもりはないですが(笑)、長年python使いを自負してきたので擁護させてください。 pythonにおける実質の文字列はunicode文字列のみです。 ごく普通に文字列に見える"XXXXX"というのは現行の2.x系ではバイナリ配列に近いもの、というかそういう用途にpythonistaのバイナリハッカーが使いまくっていて後方互換性のためもあって残されている移行途中の機構なんですよ。。。。 (言っててむなしくなってきたのでやめます。。。おっしゃる通りでわかりにくいかもしれませんよね。。。。orz) 3.x系ではもうすべてまるっと、unicode文字列です。orz
gouf

2014/12/29 16:47

@ShinpeiYamamoto なにも知らないのにテキトーなこと書いてすみません。 みんな3.x 系に早く移行できるといいのですけれど... (ライブラリの未対応が残っているとかですよね、確か...)
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問