- はじめまして,自然言語処理の初心者です.
http://www.cl.ecei.tohoku.ac.jp/nlp100/#sec00
現在,↑のサイトの2つ目の課題を行っているところです.
- 「パタトクカシーー」という文字列の1,3,5,7文字目を取り出して連結した文字列を得よ.
という課題です.
###困っていること
プログラムをターミナルで動かしたところ,
['\xe3', '\x83', '\x91', '\xe3', '\x82', '\xbf', '\xe3', '\x83', '\x88', '\xe3', '\x82', '\xaf', '\xe3', '\x82', '\xab', '\xe3', '\x82', '\xb7', '\xe3', '\x83', '\xbc', '\xe3', '\x83', '\xbc']
と符号化されて出力されました.
自然言語で文字列が出力されるようにしたいので,困っています.
###該当のソースコード
# -*- coding: utf-8 -*- sentence = "パタトクカシーー" sentence = list(sentence)#文字列の文字を一つ一つ分解しています output = sentence[0]+sentence[2]+sentence[4]+sentence[6] print sentence #output出力の前にsentenceの中身を確認しようとしていました
###試したこと
- 文字コードの確認
文字コードはターミナル,ソースコードいずれもUTF-8で記述しています.
ターミナルの設定を確認したほか,ターミナルからfile --mimeで調べました.
- .encode('utf-8')の利用
コードの一番最後のprintを,
print sentence.encode('uff-8')
と書いてみましたがうまくいきませんでした.
###補足情報(言語/FW/ツール等のバージョンなど)
python2.7.11
Sublime Text
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/07/21 05:08