質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.34%
DateTime

多くのプログラミング言語におけるDateTimeオブジェクトは、日付と時間に関する演算と出力を行います。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

15558閲覧

【Pandas】to_datetime()を使用して、文字列をdatetime64型(Timestamp型)に変換したい

beathacker

総合スコア14

DateTime

多くのプログラミング言語におけるDateTimeオブジェクトは、日付と時間に関する演算と出力を行います。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2018/12/13 15:01

編集2018/12/13 15:18

Python初心者で大変恐縮ではございますが、to_datetime()の使い方で困っております。

現在、以下に示すような文字列'date'(いずれの列もobject型(各要素は文字列str型))をpandas.to_datetime()関数を使用して、datetime64型(Timestamp型)に変換使用としているのですが、下記に示すエラーが出てしまい、何故か変換することが出来ません。

dataflame

python3

1     date 20  2018/10/01 00:00:01 31  2018/10/01 00:00:01 42  2018/10/01 00:00:01 53  2018/10/01 00:00:01 64  2018/10/01 00:00:01 7      ・ 8      ・

code

python3

1df['date'] = pd.to_datetime(df['date'], format='%Y/%m/%d %H:%M:%S') 2df

error

python3

1TypeError: --> 303 values, tz = tslib.datetime_to_datetime64(arg) 2ValueError: --> 3 df['date'] = pd.to_datetime(df['date'], format='%Y/%m/%d %H:%M:%S') 3ValueError: time data ' ' doesn't match format specified

これは文字列のどこかに' 'が含まれてしまっているから、指定のフォーマットでは読み込めない、ということなのでしょうか?

詳しい方、ご教授頂けますと幸いです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

can110

2018/12/13 15:10

codeとerrorにて、formatに相違があるようです。 codeでは「format='%Y/%m/%d %H:%M:%S'」 errorでは「format='%Y/%m/%d'」 どちらを指定していますか?
beathacker

2018/12/13 15:17

前者です!ご指摘ありがとうございます。 修正しておきます。
guest

回答2

0

これは文字列のどこかに' 'が含まれてしまっているから

はい。以下にて同様エラー再現しましたので、どこかの行に「' '」が含まれていると思われます。

Python

1import pandas as pd 2df = pd.DataFrame({'date':['2018/10/01 00:00:01',"' '"]}) 3df['date'] = pd.to_datetime(df['date'], format='%Y/%m/%d %H:%M:%S') 4""" 5Traceback (most recent call last): 6(略) 7ValueError: time data ' ' doesn't match format specified 8"""

投稿2018/12/13 15:30

can110

総合スコア38343

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

beathacker

2018/12/14 07:31

お返事頂きありがとうございます! エラーの原因を再現して頂き助かりました。
guest

0

ベストアンサー

エラーの原因は can110さんが指摘されている通り、データに ' ' が含まれているからでしょうね。

で、解決策としては、pandas.to_datetime() の引数に errors='coerce' を追加してください。
これを加えることで、無効なデータはNaT に自動的に置き換えられます。
更にformatパラメータですが、この程度のフォーマットであれば自動的に変換ががされますので特殊なフォーマットで無い限り不要かと思います。

ということで、

Python

1df['date'] = pd.to_datetime(df['date'], errors='coerce')

にて、例外を発生させることなく動作させることができるのではないでしょうか。

投稿2018/12/13 23:32

magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

beathacker

2018/12/14 07:32

無事エラーがなくなりました! 本当にありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.34%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問