前提・実現したいこと
ある機械の可動率をデータで吸い上げ、Pythonでデータ処理をして見える化しようとしています。
データシートに「曜日」の項目を追加するため、「時刻」をobject→datetimeへ変換し
その後、「時刻」が「16:00:00」のデータだけ抽出しようとしたところエラーメッセージが
発生しました。
「時刻」がdatetimeで、抽出にstr.containsを使用したためエラーが出たことはわかるのですが、
ネットを調べてもdatetimeのまま部分抽出する方法がわかりませんでした。
datetimeを再度strに変換したほうが良いのか、それともdatetimeのまま解決策があるのか
おわかりになる方、ご教授お願い致します。
発生している問題・エラーメッセージ
AttributeError
1<ipython-input-28-da444b22307a> in <module> 2----> 1 d_data = change_data[change_data['時刻'].str.contains("16:00:00")] 3 2 #d_data = change_data.query('時刻 in ["16:00:00"]') 4 3 #d_data = d_data.reset_index(drop = True) 5 4 #print(d_data) 6 7~\Anaconda3\lib\site-packages\pandas\core\generic.py in __getattr__(self, name) 8 5173 or name in self._accessors 9 5174 ): 10-> 5175 return object.__getattribute__(self, name) 11 5176 else: 12 5177 if self._info_axis._can_hold_identifiers_and_holds_name(name): 13 14~\Anaconda3\lib\site-packages\pandas\core\accessor.py in __get__(self, obj, cls) 15 173 # we're accessing the attribute of the class, i.e., Dataset.geo 16 174 return self._accessor 17--> 175 accessor_obj = self._accessor(obj) 18 176 # Replace the property with the accessor object. Inspired by: 19 177 # http://www.pydanny.com/cached-property.html 20 21~\Anaconda3\lib\site-packages\pandas\core\strings.py in __init__(self, data) 22 1915 23 1916 def __init__(self, data): 24-> 1917 self._inferred_dtype = self._validate(data) 25 1918 self._is_categorical = is_categorical_dtype(data) 26 1919 27 28~\Anaconda3\lib\site-packages\pandas\core\strings.py in _validate(data) 29 1965 30 1966 if inferred_dtype not in allowed_types: 31-> 1967 raise AttributeError("Can only use .str accessor with string " "values!") 32 1968 return inferred_dtype 33 1969 34 35AttributeError: Can only use .str accessor with string values! 36 37エラーメッセージ
該当のソースコード
Python
1import pandas as pd 2import matplotlib.pyplot as plt 3%matplotlib inline 4import datetime 5from matplotlib.font_manager import FontProperties 6fp = FontProperties(fname=r'c:\Windows\Fonts\meiryo.ttc') 7import matplotlib.dates as mdates 8import numpy as np 9from dateutil.parser import parse 10 11data1 = pd.read_csv("MCM00000000226C1313_2019-12-02.csv") 12data2 = pd.read_csv("MCM00000000226C1313_2019-12-03.csv") 13data3 = pd.read_csv("MCM00000000226C1313_2019-12-04.csv") 14data4 = pd.read_csv("MCM00000000226C1313_2019-12-05.csv") 15data5 = pd.read_csv("MCM00000000226C1313_2019-12-06.csv") 16data6 = pd.read_csv("MCM00000000226C1313_2019-12-07.csv") 17 18concat_data = pd.concat([data1,data2,data3,data4,data5,data6],ignore_index=True) #データ結合 19drop_data = concat_data.drop(['SERIAL', 'IPADDRESS', 'E4', 'STE4','STE5','CE', 'CS','PN'], axis=1) #不要なデータを削除 20drop_data.columns = ['時刻', '段取時間[s]', '総生産数[個]', '可動率[%]'] #インデックスを日本語に変換 21drop_data.round(2) #小数点第2位までの表示へ変更 22 23change_data = drop_data[['時刻','可動率[%]','総生産数[個]','段取時間[s]']] #カラムの入れ替え 24change_data['時刻'] = pd.to_datetime(change_data['時刻'],format='%Y-%m-%d') #object → datatimeへ変換 25change_data['曜日'] = change_data['時刻'].dt.strftime('%A') #カラムに「曜日」を追加 26 27d_data = change_data[change_data['時刻'].str.contains("16:00:00")] #ここでエラー発生 28
試したこと
このコードを入力してみましたが駄目でした。
d_data = change_data.query('時刻 in ["16:00:00"]')
補足情報(FW/ツールのバージョンなど)
os:windows10
jupyternotebook使用
回答1件
あなたの回答
tips
プレビュー