teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

2

更にサンプルコードを追加

2017/05/24 07:08

投稿

magichan
magichan

スコア15898

answer CHANGED
@@ -31,3 +31,61 @@
31
31
  dict型のデータには、当然 list型にデータ変換を行う ``tolist()`` メソッドが存在しませんので、ここでエラーとなっております。
32
32
 
33
33
  ただ、dict型のデータはlist型同様にそのままセルに格納することができますので、``tolist()``せずに、そのままリターンすると良いのではないでしょうか。
34
+
35
+ ---
36
+
37
+ 【更に追記です】
38
+
39
+ 質問に挙げているソースコードですが、複数のデータ('material'データのリスト)を単一のセルに押し込めている部分がどうも気になります。
40
+ 個人的には 'material'データ毎に行を分けて格納し、データ処理(取得)時に``groupby()`` でまとめた方が管理しやすいと思います。
41
+
42
+ ということで、簡単にサンプルを書きました。
43
+
44
+ ```Python
45
+ from datetime import datetime, date,time,timedelta
46
+ import pandas as pd
47
+
48
+ my_parser = lambda x: pd.datetime.strptime(x, '%H:%M:%S').time()
49
+
50
+ # machine.csv の読み込み('time'を'start_time'にRename / 'end_time'を追加)
51
+ df_mach = pd.read_csv('machine.csv', date_parser=my_parser, parse_dates=['time']).rename(columns={'time':'start_time'})
52
+ df_mach['end_time'] = df_mach.apply(lambda d:datetime.combine(date.today(), d.start_time) + timedelta(seconds=5), axis=1).dt.time
53
+
54
+ # material.csv の読み込み
55
+ df_mate = pd.read_csv('material.csv', date_parser=my_parser, parse_dates=['time'])
56
+
57
+ # machineデータとmaterialデータをマージ(時間範囲外は削除)
58
+ df = df_mach.merge(df_mate, on='machine')
59
+ df = df[(df.start_time<=df.time) & (df.time<=df.end_time)].reset_index(drop=True)
60
+ print(df)
61
+ ```
62
+
63
+ やっていることは ``machine.csv``と``material.csv``をマージしただけです。
64
+ (重複削除はしておりません)
65
+
66
+ で、データ取得時に
67
+
68
+ ```Python
69
+ grp = df.groupby(['start_time','machine'])
70
+
71
+ # 全グループを取得
72
+ print(grp.groups)
73
+
74
+ # 10:00:20 開始のMachine-Bのデータを取得
75
+ print(grp.get_group((time(10,0,10),'B')))
76
+
77
+ # 上記のデータの materialのリストを取得して重複削除
78
+ print(grp.get_group((time(10,0,20),'B'))['material'].drop_duplicates())
79
+
80
+ # 前回の解答と同等のデータフレームを作成
81
+ print(grp.apply(lambda d: d['material'].drop_duplicates().tolist()))
82
+
83
+ # 全グループのデータをループ処理
84
+ for key, data in grp:
85
+ print(key)
86
+ print(data['material'].drop_duplicates())
87
+ ```
88
+
89
+ と様々な処理をする事ができます。
90
+
91
+

1

追加の質問に関する答えを追加

2017/05/24 07:08

投稿

magichan
magichan

スコア15898

answer CHANGED
@@ -12,4 +12,22 @@
12
12
  return None if matches.empty else use_m.tolist()
13
13
  ```
14
14
 
15
- のように修正して、**リスト型**のデータを戻すようにすると良いのではないでしょうか。
15
+ のように修正して、**リスト型**のデータを戻すようにすると良いのではないでしょうか。
16
+
17
+ ---
18
+
19
+ **【追加質問に関して】**
20
+
21
+ 質問のコードでは
22
+
23
+ ```Python
24
+ use_m = matches.drop_duplicates(['material'])['material']
25
+ ```
26
+ と``use_m``に Pandas.Seriesデータが入っているのですが、
27
+ ``apply()`` のリターン値はそのままセルに格納されますので、リターンにて そのままの Seriesデータを返すとエラーとなってしまいます。(前回の質問)
28
+ そこで、``Pandas.Series.tolist()`` にてSeriesデータをlist型のデータに変換することで問題を回避しております。(前回の解答)
29
+
30
+ しかしながら、実際のコードでは ``use_m`` にdict型のデータが格納されているようです(原因はわかりませんが・・)。
31
+ dict型のデータには、当然 list型にデータ変換を行う ``tolist()`` メソッドが存在しませんので、ここでエラーとなっております。
32
+
33
+ ただ、dict型のデータはlist型同様にそのままセルに格納することができますので、``tolist()``せずに、そのままリターンすると良いのではないでしょうか。