質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

2回答

1423閲覧

pandas でtxt ファイルを開こうとすると'utf-8' codec can't decode byte 0xa0 と表示される

trey_0329

総合スコア109

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2019/01/29 13:38

編集2019/01/29 14:20

<背景>
企業データが入ったtxt fileを使ってデータ分析をしたいと考えています。
そのためにtxt fileに入った企業データをdataframeで表示しようとしています。

<環境>
Mac / Python 3.6.7

<問題>
pandasでデータが入ったtxt fileを

python

1import pandas as pd 2data = pd.read_table('companies.txt') 3data 4```開こうとすると, 5UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa0 in position 25: invalid start byte 6と表示されてしまいます。 7 8<試した解決策> 91) utf-8を指定 10```python 11data = pd.read_table('companies.txt', encoding="utf-8") 12data

2)stack over flowで見かけた回答を試す(https://stackoverflow.com/questions/12468179/unicodedecodeerror-utf8-codec-cant-decode-byte-0x9c)

data = pd.read_table('companies.txt', errors='replace') data = pd.read_table('companies.txt', errors='ignore')

他にも一通りネットで見かけるものを試しましたが、うまくいきません。
お手数ですがどなたかわかる方、ご教授お願い致します

---追記
data = pd.read_table('companies.txt', engine='python')を実行すると、このように表示されますがこれは正しいdataframeの形なのでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Stan_Dma

2019/01/29 13:49

The character encoding of the original text file seems to be corrupted, I think. BTW, don't you have any problem in making it public?!
trey_0329

2019/01/29 13:58

Thx for your answer - is there any way to read this file? No problem as this data doesn't contain any critical information.
trey_0329

2019/01/29 14:11

Now it is working! Thx
guest

回答2

0

python

1import pandas as pd 2data = pd.read_table('companies.txt', engine='python') 3data

で解決いたしました。
redpさん、Stan_Dmaさんありがとうございました

投稿2019/01/29 14:11

trey_0329

総合スコア109

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

そのStackOverFlow内の回答に

data = pd.read_table('companies.txt', engine='python')

というものがあって私の環境ではこれでエラー出なかったのですがどうでしょうか。

投稿2019/01/29 13:56

redp

総合スコア49

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

trey_0329

2019/01/29 14:01

回答ありがとうございます。おっしゃる通りそちらでエラーなしに動いてはいるのですが、dataframeとして綺麗に表示されてないので、適切な方法ではないのかな、と思っていました
trey_0329

2019/01/29 14:05

私のjupyterで表示されたdataframeのスクショを追記しました
redp

2019/01/29 14:07

companies.txtという引数が2つあるのですが1つでもダメでしたか?
trey_0329

2019/01/29 14:09

無事に表示されました・・・すみません、かなり初歩的なミスでした。ご指摘誠にありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問