teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

4

a

2021/09/11 08:10

投稿

esklia
esklia

スコア81

title CHANGED
File without changes
body CHANGED
@@ -48,7 +48,9 @@
48
48
 
49
49
  ```
50
50
  のようにコメント部分を出力するのみで、どんどん実行していっても文字列だけがこんそーつに出力される状態です。
51
+
51
- 出力
52
+ コンソールの出力、「> # (5) 集計による比較」以降はコードが一切実行されず文字列のみコンソールに出力されています。ほぼ毎回クラッシュします。
53
+
52
54
  ```
53
55
  > # (3) データの読み込み
54
56
  > email_data <- read_csv("http://www.minethatdata.com/Kevin_Hillstrom_MineThatData_E-MailAnalytics_DataMiningChallenge_2008.03.20.csv")

3

2021/09/11 08:10

投稿

esklia
esklia

スコア81

title CHANGED
File without changes
body CHANGED
@@ -11,14 +11,16 @@
11
11
  コードを追記しました。
12
12
  ```
13
13
 
14
-
14
+ # (3) データの読み込み
15
15
  email_data <- read_csv("http://www.minethatdata.com/Kevin_Hillstrom_MineThatData_E-MailAnalytics_DataMiningChallenge_2008.03.20.csv")
16
16
 
17
17
  # (4) データの準備
18
+ ## 女性向けメールが配信されたデータを削除したデータを作成
18
19
  male_df <- email_data %>%
19
20
  dplyr::filter(segment != "Womens E-Mail") %>% # 女性向けメールが配信されたデータを削除
20
21
  mutate(treatment = ifelse(segment == "Mens E-Mail", 1, 0)) #介入を表すtreatment変数を追加
21
22
 
23
+ # (5) 集計による比較
22
24
  ## group_byとsummairseを使って集計
23
25
  summary_by_segment <- male_df %>%
24
26
  group_by(treatment) %>% # データのグループ化
@@ -26,6 +28,12 @@
26
28
  spend_mean = mean(spend), # グループごとのspendの平均
27
29
  count = n()) # グループごとのデータ数
28
30
  print(summary_by_segment)
31
+
32
+ # (6) t検定を行う
33
+ ## (a)男性向けメールが配信されたグループの購買データを得る
34
+ mens_mail <- male_df %>%
35
+ dplyr::filter(treatment == 1) %>%
36
+ pull(spend)
29
37
 
30
38
  ```
31
39
  この場合、`## group_byとsummairseを使って集計`

2

追記いたしました。

2021/09/11 08:08

投稿

esklia
esklia

スコア81

title CHANGED
File without changes
body CHANGED
@@ -5,4 +5,70 @@
5
5
 
6
6
  という不具合が生じています。ぐぐっても類似の症状が出てこなかったので質問させていただきました。この原因と考えられる対策を教えていただけませんか。
7
7
 
8
- ![イメージ説明](bb3241c4675dc33c36c61179651b52d5.png)
8
+ ![イメージ説明](bb3241c4675dc33c36c61179651b52d5.png)
9
+
10
+ 追記
11
+ コードを追記しました。
12
+ ```
13
+
14
+
15
+ email_data <- read_csv("http://www.minethatdata.com/Kevin_Hillstrom_MineThatData_E-MailAnalytics_DataMiningChallenge_2008.03.20.csv")
16
+
17
+ # (4) データの準備
18
+ male_df <- email_data %>%
19
+ dplyr::filter(segment != "Womens E-Mail") %>% # 女性向けメールが配信されたデータを削除
20
+ mutate(treatment = ifelse(segment == "Mens E-Mail", 1, 0)) #介入を表すtreatment変数を追加
21
+
22
+ ## group_byとsummairseを使って集計
23
+ summary_by_segment <- male_df %>%
24
+ group_by(treatment) %>% # データのグループ化
25
+ summarise(conversion_rate = mean(conversion), # グループごとのconversionの平均
26
+ spend_mean = mean(spend), # グループごとのspendの平均
27
+ count = n()) # グループごとのデータ数
28
+ print(summary_by_segment)
29
+
30
+ ```
31
+ この場合、`## group_byとsummairseを使って集計`
32
+ より下のコードをctrl+enterで実行しようとすると` # (5) 集計による比較`
33
+ とだけコンソールに出力され、コードが急に実行されなくなります。
34
+
35
+ それからは、同一のセルを実行しようとしても
36
+ ```
37
+ > # (5) 集計による比較
38
+ # (5) 集計による比較
39
+ # (5) 集計による比較
40
+
41
+ ```
42
+ のようにコメント部分を出力するのみで、どんどん実行していっても文字列だけがこんそーつに出力される状態です。
43
+ 出力
44
+ ```
45
+ > # (3) データの読み込み
46
+ > email_data <- read_csv("http://www.minethatdata.com/Kevin_Hillstrom_MineThatData_E-MailAnalytics_DataMiningChallenge_2008.03.20.csv")
47
+ Rows: 64000 Columns: 12
48
+ -- Column specification ---------------------------
49
+ Delimiter: ","
50
+ chr (4): history_segment, zip_code, channel, se...
51
+ dbl (8): recency, history, mens, womens, newbie...
52
+
53
+ i Use `spec()` to retrieve the full column specification for this data.
54
+ i Specify the column types or set `show_col_types = FALSE` to quiet this message.
55
+ > # (4) データの準備
56
+ > ## 女性向けメールが配信されたデータを削除したデータを作成
57
+ > male_df <- email_data %>%
58
+ + dplyr::filter(segment != "Womens E-Mail") %>% # 女性向けメールが配信されたデータを削除
59
+ + mutate(treatment = ifelse(segment == "Mens E-Mail", 1, 0)) #介入を表すtreatment変数を追加
60
+ > # (5) 集計による比較
61
+ -----------------ここから下はもうバグっている状態でコードが実行されず、セーブもできなくなっています。----------------------
62
+ # (5) 集計による比較
63
+ # (5) 集計による比較
64
+
65
+ print(summary_by_segment)
66
+ # (6) t検定を行う
67
+ ## (b)メールが配信されなかったグループの購買データを得る
68
+ ## (a)(b)の平均の差に対して有意差検定を実行する
69
+ # (7) セレクションバイアスのあるデータの作成
70
+ ## 条件に反応するサンプルの量を半分にする
71
+ obs_rate_t <- 0.5
72
+ ## バイアスのあるデータの作成
73
+
74
+ ```

1

2021/09/11 08:06

投稿

esklia
esklia

スコア81

title CHANGED
File without changes
body CHANGED
@@ -1,5 +1,5 @@
1
1
  Rstudio初心者なのですが、
2
- 表題の通り、
2
+ 表題の通り、特に前触れなく(それほど大きい処理を行ったわけでもなく、)
3
3
  ・下記画像右のようにRstuioで操作するファイル名が赤くなり、上書き保存ができなくなる
4
4
  ・下記画像左のように、プログラムの実行ができなくなる
5
5