回答編集履歴

更にサンプルコードを追加

2017/05/24 07:08

投稿

magichan

スコア15898

answer CHANGED Viewed

@@ -31,3 +31,61 @@
 dict型のデータには、当然 list型にデータ変換を行う ``tolist()`` メソッドが存在しませんので、ここでエラーとなっております。
 ただ、dict型のデータはlist型同様にそのままセルに格納することができますので、``tolist()``せずに、そのままリターンすると良いのではないでしょうか。
+---
+【更に追記です】
+質問に挙げているソースコードですが、複数のデータ（'material'データのリスト）を単一のセルに押し込めている部分がどうも気になります。
+個人的には 'material'データ毎に行を分けて格納し、データ処理（取得）時に``groupby()`` でまとめた方が管理しやすいと思います。
+ということで、簡単にサンプルを書きました。
+```Python
+from datetime import datetime, date,time,timedelta
+import pandas as pd
+my_parser = lambda x: pd.datetime.strptime(x, '%H:%M:%S').time()
+# machine.csv の読み込み('time'を'start_time'にRename / 'end_time'を追加)
+df_mach = pd.read_csv('machine.csv', date_parser=my_parser, parse_dates=['time']).rename(columns={'time':'start_time'})
+df_mach['end_time'] = df_mach.apply(lambda d:datetime.combine(date.today(), d.start_time) + timedelta(seconds=5), axis=1).dt.time
+# material.csv の読み込み
+df_mate = pd.read_csv('material.csv', date_parser=my_parser, parse_dates=['time'])
+# machineデータとmaterialデータをマージ（時間範囲外は削除）
+df = df_mach.merge(df_mate, on='machine')
+df = df[(df.start_time<=df.time) & (df.time<=df.end_time)].reset_index(drop=True)
+print(df)
+```
+やっていることは ``machine.csv``と``material.csv``をマージしただけです。
+（重複削除はしておりません）
+で、データ取得時に
+```Python
+grp = df.groupby(['start_time','machine'])
+# 全グループを取得
+print(grp.groups)
+# 10:00:20 開始のMachine-Bのデータを取得
+print(grp.get_group((time(10,0,10),'B')))
+# 上記のデータの materialのリストを取得して重複削除
+print(grp.get_group((time(10,0,20),'B'))['material'].drop_duplicates())
+# 前回の解答と同等のデータフレームを作成
+print(grp.apply(lambda d: d['material'].drop_duplicates().tolist()))
+# 全グループのデータをループ処理
+for key, data in grp:
+    print(key)
+    print(data['material'].drop_duplicates())
+```
+と様々な処理をする事ができます。

追加の質問に関する答えを追加

2017/05/24 07:08

投稿

magichan

スコア15898

answer CHANGED Viewed

@@ -12,4 +12,22 @@
     return None if matches.empty else use_m.tolist()
 ```
-のように修正して、**リスト型**のデータを戻すようにすると良いのではないでしょうか。
+のように修正して、**リスト型**のデータを戻すようにすると良いのではないでしょうか。
+---
+**【追加質問に関して】**
+質問のコードでは
+```Python
+use_m = matches.drop_duplicates(['material'])['material']
+```
+と``use_m``に Pandas.Seriesデータが入っているのですが、
+``apply()`` のリターン値はそのままセルに格納されますので、リターンにて そのままの Seriesデータを返すとエラーとなってしまいます。（前回の質問）
+そこで、``Pandas.Series.tolist()`` にてSeriesデータをlist型のデータに変換することで問題を回避しております。（前回の解答）
+しかしながら、実際のコードでは ``use_m`` にdict型のデータが格納されているようです（原因はわかりませんが・・）。
+dict型のデータには、当然 list型にデータ変換を行う ``tolist()`` メソッドが存在しませんので、ここでエラーとなっております。
+ただ、dict型のデータはlist型同様にそのままセルに格納することができますので、``tolist()``せずに、そのままリターンすると良いのではないでしょうか。