info()が使える箇所と使えない箇所がある

前提・実現したいこと

ある購買データを加工しようとしているのですが、
pd.to_datetimeで型を変えたkeyが
本当にdatetime型に変わっているかを確認するために
.info()を使って確認したいのですが、
属性エラーが起きてしまいます。
因みにデータをインポートした直後に
.info()をすると正常に作動します。

発生している問題・エラーメッセージ

AttributeError: 'Series' object has no attribute 'info'

該当のソースコード

python
1trn =pd.to_datetime(trn['date_purchase_c'], format='%Y/%m/%d')
2trn.info()

試したこと

データをインポートした直後のtrn.info()では、
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4308392 entries, 0 to 4308391
Data columns (total 39 columns):
cst_id object
date_purchase_c object
date_purchase_n int64
yymm_purchase int64
InsDate object
dhms_InsDate int64
Trn_Type object
rev int64
num int64
code int64
Item object
Sub_Item object
sex object
age_asof_purchase_cat object
St_Region object
Season object
dtypes: int64(12), object(27)
memory usage: 1.3+ GB

このように正常に作動します。

何卒宜しくお願い致します。

追記

Python
1#インポートライブラリ
2import pandas as pd
3import numpy as np
4import scipy as sp
5import matplotlib.pyplot as plt
6import matplotlib as mpl
7import datetime as dt
8import seaborn as sns
9import io
10%precision 3
11
12cst = pd.read_csv(r'G:\～～～点.csv', engine='python',
13                   dtype={'cst_id':'object','yymm_entry':'object','PostNo':'object'}) 
14trn = pd.read_csv(r'G:\_201502_20190602.csv', engine='python',
15                  dtype={'cst_id':'object','TranLineNo':'object','Store_code':'object'})
16
17cst.info()
18trn.info()
19cst.drop_duplicates()
20cst = cst.drop(['date_entry_n', 'birthday_n'], axis=1)
21cst.info()
22trn =pd.to_datetime(trn['date_purchase_c'], format='%Y/%m/%d')
23trn.drop_duplicates().head()
24trn_tmp = trn.copy()
25trn_tmp['date_purchase_c']=pd.datetime(trn_tmp['date_purchase_c'],
26                                      format='%Y/%m/%d')
27trn_tmp.info()

行動規範の内容に同意します

回答1件

ベストアンサー

エラーの通り、Series型には.info（）はありません。
pandasにはDataFrame型とSeries型を主に扱うのですが、Series型はDataFrameの１つのカラム（つまり、縦一列）に相当します。
サクッと検索してヒットした記事を添付しておきます。
僕のpandas.SeriesとDataFrameのイメージは間違っていた

さて今回の件、サクッと解決するには、Series型をDataFrame型に変えてあげれば解決します。

python
1trn =pd.to_datetime(trn['date_purchase_c'], format='%Y/%m/%d')
2pd.DataFrame({
3  'trn': trn
4}).info()

あと、Series型でも、中身の型を確認したいだけなら、.dtypeを使えば確認できます。

python
1trn =pd.to_datetime(trn['date_purchase_c'], format='%Y/%m/%d')
2trn.dtype

また、.describe()を使えば型に合わせた記述統計が出てくるので、個人的にはこちらの方がオススメです。

python
1trn =pd.to_datetime(trn['date_purchase_c'], format='%Y/%m/%d')
2trn.describe()

投稿2019/07/29 06:03

haritoshi

総合スコア79

Pablito

2019/07/29 06:12

ご回答ありがとうございます！なるほど！そういうことだったのですね。私の理解が浅かったです。アドバイス大変にありがとうございました。

Pablito

2019/07/29 06:18

アドレス頂いた通りに実行すると、 <class 'pandas.core.frame.DataFrame'> RangeIndex: 4308392 entries, 0 to 4308391 Data columns (total 1 columns): trn datetime64[ns] dtypes: datetime64[ns](1) memory usage: 32.9 MB という結果が得られました。

Pablito

2019/07/29 06:20

これは少しイメージと違います。私としては質問にもあるような <class 'pandas.core.frame.DataFrame'> RangeIndex: 4308392 entries, 0 to 4308391 Data columns (total 39 columns): cst_id object date_purchase_c object date_purchase_n int64 yymm_purchase int64 InsDate object このような形をイメージしていました。これは私のpd.to_datetimeのやり方が悪いのでしょうか？？？

haritoshi

2019/07/29 06:29

ああ、なるほど、要求が理解できました。 ``` trn_tmp = trn.copy() trn_tmp['date_purchase_c'] =pd.to_datetime(trn_tmp['date_purchase_c'], format='%Y/%m/%d') trn_tmp.info() ``` これでどうでしょう？

Pablito

2019/07/29 06:40

質問が分かりづらくてすいません。アドバイス通りに実行してみたのですが、 KeyError: 'date_purchase_c' が起きてしまいました。。。。時々こうした予期せぬkey errorが起きてしまいます。

haritoshi

2019/07/29 06:50

推測するに、その時点でtrnがSeries型に変わってしまっているからです。もしjupyterを使っているなら、カーネルの初期化を行ってください。あと、データ分析をする上でのチップスみたいなものですが、生データを入れたDataFrameは編集しないで、別の編集して良いDataFrameを作成しましょう。そうすることで、今の状態のように、「ここまで実行したはずだからこれは実行できなくなっている」等の考慮がなくなるはずです。具体的には、カーネルの初期化をしてから下のもののみ実行してください。 df_raw = pd.read_csv等 # 生データを読み込み、このデータは移行変更しない df_tmp = df_raw.copy() # 生データを変更しないようにDataFrameをディープコピー df_tmp['date_purchase_c'] =pd.to_datetime(df_tmp['date_purchase_c'], format='%Y/%m/%d') df_tmp.info()

Pablito

2019/07/29 06:55

なるほど！素晴らしい！早速やってみます！

Pablito

2019/07/29 07:01

と言いつつ初期化の仕方が分からないのですが、ご教示願いませんか？？？

haritoshi

2019/07/29 07:03

jupyterであれば、上のバーにある Kernel > Restart です。

Pablito

2019/07/29 07:04

もしくはただ単にrestartするだけですか？？？