Q&A
解決済
2回答
7165閲覧
総合スコア7
Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。
Unicodeはエンコーディングの標準規格です。1つの文字コード体系で多国語の表現を可能にすることを目指して作られています。
UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。
文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。
Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。
0グッド
0クリップ
投稿2017/03/11 09:34
0
Python 文字コード リスト
Macでコーティングしています。 CSV文字列データをcodecs.openで開いてそれをMeCabで形態素解析してリストにまとめるプログラムを作っています。 そのListの中身を一つずつ出力すると文字化けしないのですが、printでListを一気に出力すると文字化けします。これを文字化けしないようにするにはどうしたら良いのでしょうか? utf-8でcodingしています。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
質問へのコメント
回答2件
ベストアンサー
Python2 では、そうなります。 Python3 では、リストの中身も文字コードではなく、表示されます。
Python3で、表示できるようになったのは、以下のPEPで決められ作られています。 https://www.python.org/dev/peps/pep-3138/
投稿2017/03/12 13:31
総合スコア313
そのListの中身を一つずつ出力すると文字化けしないのですが、printでListを一気に出力すると文字化けします。これを文字化けしないようにするにはどうしたら良いのでしょうか?
一つずつ出力すればいいんじゃないですか? 問題点を明確にしてソースを掲示してください。
追記
問題点を明確にしてソースを出せと言ってもただ無言マイナスがついただけで何の反応もないので、それらをこちらで勝手に推測します。こういうことじゃないですか?
【Python 2.7】日本語を要素に含むオブジェクトの標準出力は、print( pp ( オブジェクト ) ) 書式で、日本語文字列として出力可能
投稿2017/03/12 03:31
総合スコア28675
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
15分調べてもわからないことはteratailで質問しよう!
ただいまの回答率85.29%
質問をまとめることで思考を整理して素早く解決
テンプレート機能で簡単に質問をまとめる
Python 文字コード List 文字化け
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。