質問編集履歴

4

a

2021/09/11 08:10

投稿

esklia
esklia

スコア81

test CHANGED
File without changes
test CHANGED
@@ -98,7 +98,11 @@
98
98
 
99
99
  のようにコメント部分を出力するのみで、どんどん実行していっても文字列だけがこんそーつに出力される状態です。
100
100
 
101
+
102
+
101
- 出力
103
+ コンソールの出力、「> # (5) 集計による比較」以降はコードが一切実行されず文字列のみコンソールに出力されています。ほぼ毎回クラッシュします。
104
+
105
+
102
106
 
103
107
  ```
104
108
 

3

2021/09/11 08:10

投稿

esklia
esklia

スコア81

test CHANGED
File without changes
test CHANGED
@@ -24,13 +24,15 @@
24
24
 
25
25
 
26
26
 
27
-
27
+ # (3) データの読み込み
28
28
 
29
29
  email_data <- read_csv("http://www.minethatdata.com/Kevin_Hillstrom_MineThatData_E-MailAnalytics_DataMiningChallenge_2008.03.20.csv")
30
30
 
31
31
 
32
32
 
33
33
  # (4) データの準備
34
+
35
+ ## 女性向けメールが配信されたデータを削除したデータを作成
34
36
 
35
37
  male_df <- email_data %>%
36
38
 
@@ -39,6 +41,8 @@
39
41
  mutate(treatment = ifelse(segment == "Mens E-Mail", 1, 0)) #介入を表すtreatment変数を追加
40
42
 
41
43
 
44
+
45
+ # (5) 集計による比較
42
46
 
43
47
  ## group_byとsummairseを使って集計
44
48
 
@@ -53,6 +57,18 @@
53
57
  count = n()) # グループごとのデータ数
54
58
 
55
59
  print(summary_by_segment)
60
+
61
+
62
+
63
+ # (6) t検定を行う
64
+
65
+ ## (a)男性向けメールが配信されたグループの購買データを得る
66
+
67
+ mens_mail <- male_df %>%
68
+
69
+ dplyr::filter(treatment == 1) %>%
70
+
71
+ pull(spend)
56
72
 
57
73
 
58
74
 

2

追記いたしました。

2021/09/11 08:08

投稿

esklia
esklia

スコア81

test CHANGED
File without changes
test CHANGED
@@ -13,3 +13,135 @@
13
13
 
14
14
 
15
15
  ![イメージ説明](bb3241c4675dc33c36c61179651b52d5.png)
16
+
17
+
18
+
19
+ 追記
20
+
21
+ コードを追記しました。
22
+
23
+ ```
24
+
25
+
26
+
27
+
28
+
29
+ email_data <- read_csv("http://www.minethatdata.com/Kevin_Hillstrom_MineThatData_E-MailAnalytics_DataMiningChallenge_2008.03.20.csv")
30
+
31
+
32
+
33
+ # (4) データの準備
34
+
35
+ male_df <- email_data %>%
36
+
37
+ dplyr::filter(segment != "Womens E-Mail") %>% # 女性向けメールが配信されたデータを削除
38
+
39
+ mutate(treatment = ifelse(segment == "Mens E-Mail", 1, 0)) #介入を表すtreatment変数を追加
40
+
41
+
42
+
43
+ ## group_byとsummairseを使って集計
44
+
45
+ summary_by_segment <- male_df %>%
46
+
47
+ group_by(treatment) %>% # データのグループ化
48
+
49
+ summarise(conversion_rate = mean(conversion), # グループごとのconversionの平均
50
+
51
+ spend_mean = mean(spend), # グループごとのspendの平均
52
+
53
+ count = n()) # グループごとのデータ数
54
+
55
+ print(summary_by_segment)
56
+
57
+
58
+
59
+ ```
60
+
61
+ この場合、`## group_byとsummairseを使って集計`
62
+
63
+ より下のコードをctrl+enterで実行しようとすると` # (5) 集計による比較`
64
+
65
+ とだけコンソールに出力され、コードが急に実行されなくなります。
66
+
67
+
68
+
69
+ それからは、同一のセルを実行しようとしても
70
+
71
+ ```
72
+
73
+ > # (5) 集計による比較
74
+
75
+ # (5) 集計による比較
76
+
77
+ # (5) 集計による比較
78
+
79
+
80
+
81
+ ```
82
+
83
+ のようにコメント部分を出力するのみで、どんどん実行していっても文字列だけがこんそーつに出力される状態です。
84
+
85
+ 出力
86
+
87
+ ```
88
+
89
+ > # (3) データの読み込み
90
+
91
+ > email_data <- read_csv("http://www.minethatdata.com/Kevin_Hillstrom_MineThatData_E-MailAnalytics_DataMiningChallenge_2008.03.20.csv")
92
+
93
+ Rows: 64000 Columns: 12
94
+
95
+ -- Column specification ---------------------------
96
+
97
+ Delimiter: ","
98
+
99
+ chr (4): history_segment, zip_code, channel, se...
100
+
101
+ dbl (8): recency, history, mens, womens, newbie...
102
+
103
+
104
+
105
+ i Use `spec()` to retrieve the full column specification for this data.
106
+
107
+ i Specify the column types or set `show_col_types = FALSE` to quiet this message.
108
+
109
+ > # (4) データの準備
110
+
111
+ > ## 女性向けメールが配信されたデータを削除したデータを作成
112
+
113
+ > male_df <- email_data %>%
114
+
115
+ + dplyr::filter(segment != "Womens E-Mail") %>% # 女性向けメールが配信されたデータを削除
116
+
117
+ + mutate(treatment = ifelse(segment == "Mens E-Mail", 1, 0)) #介入を表すtreatment変数を追加
118
+
119
+ > # (5) 集計による比較
120
+
121
+ -----------------ここから下はもうバグっている状態でコードが実行されず、セーブもできなくなっています。----------------------
122
+
123
+ # (5) 集計による比較
124
+
125
+ # (5) 集計による比較
126
+
127
+
128
+
129
+ print(summary_by_segment)
130
+
131
+ # (6) t検定を行う
132
+
133
+ ## (b)メールが配信されなかったグループの購買データを得る
134
+
135
+ ## (a)(b)の平均の差に対して有意差検定を実行する
136
+
137
+ # (7) セレクションバイアスのあるデータの作成
138
+
139
+ ## 条件に反応するサンプルの量を半分にする
140
+
141
+ obs_rate_t <- 0.5
142
+
143
+ ## バイアスのあるデータの作成
144
+
145
+
146
+
147
+ ```

1

2021/09/11 08:06

投稿

esklia
esklia

スコア81

test CHANGED
File without changes
test CHANGED
@@ -1,6 +1,6 @@
1
1
  Rstudio初心者なのですが、
2
2
 
3
- 表題の通り、
3
+ 表題の通り、特に前触れなく(それほど大きい処理を行ったわけでもなく、)
4
4
 
5
5
  ・下記画像右のようにRstuioで操作するファイル名が赤くなり、上書き保存ができなくなる
6
6