質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.31%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1248閲覧

invalid literal for int() with base 10: ''について

退会済みユーザー

退会済みユーザー

総合スコア0

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2023/02/09 08:12

編集2023/02/09 08:16

実現したいこと

df['atime'] = df['atime'].astype(int)でデータフレームを整理しようとしていると
invalid literal for int() with base 10: ''というエラーがでたのですが,この''はどうすればreplaceで置き換えられるか知りたいです。

前提

ここに質問の内容を詳しく書いてください。
pandasでデータフレームを扱っていてこのエラーに出くわしました。

発生している問題・エラーメッセージ

df['atime'] = df['atime'].astype(int)
ValueError: invalid literal for int() with base 10: ''

該当のソースコード

試したこと

df['atime'] = df['atime'].str.replace('.', '').str.replace('"', '').replace(' ', '')
あるいは
df['atime'] = df['atime'].replace('.', '').replace('"', '').replace(' ', '')
などを試しましたがうまくいきません。
よろしくお願いします。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

can110

2023/02/09 08:20

エラーは詳細がわかるように全文(Traceback)を提示ください。 また提示コードには`int()`を呼び出しているところがないように見えますが、コードは合っているでしょうか? コードは断片ではなく、第三者が実行あるいは検証できる程度の範囲まで提示ください。
melian

2023/02/09 08:27 編集

何に置き換えるかに依りますが、例えば 0 に置換するのであれば以下になります。 import pandas as pd df = pd.DataFrame({'atime': ['1', '2', '3', '']}) #df['atime'] = df['atime'].astype(int) #df['atime'] = pd.to_numeric(df['atime'], errors='ignore') df['atime'] = df['atime'].replace('', 0) print(df)
退会済みユーザー

退会済みユーザー

2023/02/09 09:19

#df['atime'] = pd.to_numeric(df['atime'], errors='ignore'これは使えそうですね。errorsは色々と応用が利きそうなのでまた使います。コメントありがとうございました。
melian

2023/02/09 09:28

ちなみに、fillna() には downcast というキーワードがあって、これに 'infer' を渡すと、float から int に変更可能な場合は int に変更してくれます。 df['atime'] = pd.to_numeric(df['atime'], errors='ignore').fillna(0, downcast='infer')
退会済みユーザー

退会済みユーザー

2023/02/09 09:38

float型もint型にしてくれるんですね。これも使えそうですね。fillnaをこんな風に使ったことがなかったので教えてもらってありがたいです。
guest

回答1

0

ベストアンサー

提示コードでは元データに空文字列が含まれているため提示エラーが発生しています。
空文字列以外でもintに変換できないものにどのようなものがあるか?それをどうするか?によりますが、とりあえずto_numericerrors='coerce'を指定することにより空文字を含め数値に変換できないものはNaNになります。
それを0にしたあとでintに変換すればよいです。実数値は切り捨てられます。

Python

1import pandas as pd 2 3sr = pd.Series(['123',None,'abc','12.3','']) 4ret = pd.to_numeric(sr, errors='coerce').fillna(0).astype(int) 5print(ret) 6""" 70 123 81 0 92 0 103 12 114 0 12dtype: int32 13"""

投稿2023/02/09 08:37

can110

総合スコア38352

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2023/02/09 09:25

拙い質問に答えていただいてありがとうございます。これで解決しました。ありがとうございます。ほかのカラムにも使えそうなコードなのでありがたいです。 エラーの内容についてですが30行ぐらいあるエラーの内容も質問のところで張り付けてもよかったのでしょうか?ValueErrorの箇所だけだとわかりづらいということですよね?
can110

2023/02/09 10:07

> エラーの内容についてですが30行ぐらいあるエラーの内容も はい。 全文(traceback)にはエラーの発生場所、詳細が含まれるので大事です。 その中にディレクトリ名などにユーザー名など含まれている場合は伏せてもらってかまいません。
退会済みユーザー

退会済みユーザー

2023/02/09 10:15

なるほど。次からはそのあたりを気を付けて質問をしてみたいと思います。 解決してくれてありがとうございました。
can110

2023/02/09 10:19

以下に質問の仕方が丁寧に説明されています。 https://teratail.com/help/question-tips これにのっとると分かりやすく質問をまとめることができ 回答も得られやすくなるので、一読することをおすすめします。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問