teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

3

追記

2020/04/09 12:26

投稿

yukicb
yukicb

スコア21

title CHANGED
File without changes
body CHANGED
@@ -48,9 +48,6 @@
48
48
  import pandas as pd
49
49
  import numpy as np
50
50
 
51
- #train.csvはタイタニック提供のデータをそのまま利用しています。
52
- titanic_train=pd.read_csv("train.csv")
53
-
54
51
  only_train_honorific=["Capt","Don","Jonkheer","Lady","Major","Mlle","Mme","Sir","the Countess"]
55
52
  train_omit1=titanic_train[~titanic_train["honorific"].isin(only_train_honorific)].reset_index(drop=True)
56
53
  print(train_omit1)
@@ -58,14 +55,20 @@
58
55
 
59
56
  ### 追記
60
57
  ```Python3
58
+ import pandas as pd
59
+
60
+ #train.csvはタイタニック提供のデータをそのまま利用しています。
61
+ titanic_train=pd.read_csv("train.csv")
62
+
61
63
  only_train_honorific=["Capt","Don","Jonkheer","Lady","Major","Mlle","Mme","Sir","the Countess",]
62
64
  titanic_train["honorific"]=titanic_train["Name"].map(lambda x: x.split(",")[1].split(".")[0])
63
65
  train_omit1=titanic_train[~titanic_train["honorific"].isin(only_train_honorific)].reset_index(drop=True)
64
66
  print(titanic_train["honorific"].value_counts())
65
67
  print(train_omit1["honorific"].value_counts())
66
68
  ```
67
- print結果
69
+
68
70
  ```Python3
71
+ #print結果
69
72
  Mr 517
70
73
  Miss 182
71
74
  Mrs 125

2

追記

2020/04/09 12:25

投稿

yukicb
yukicb

スコア21

title CHANGED
File without changes
body CHANGED
@@ -48,7 +48,58 @@
48
48
  import pandas as pd
49
49
  import numpy as np
50
50
 
51
+ #train.csvはタイタニック提供のデータをそのまま利用しています。
52
+ titanic_train=pd.read_csv("train.csv")
53
+
51
54
  only_train_honorific=["Capt","Don","Jonkheer","Lady","Major","Mlle","Mme","Sir","the Countess"]
52
55
  train_omit1=titanic_train[~titanic_train["honorific"].isin(only_train_honorific)].reset_index(drop=True)
53
56
  print(train_omit1)
57
+ ```
58
+
59
+ ### 追記
60
+ ```Python3
61
+ only_train_honorific=["Capt","Don","Jonkheer","Lady","Major","Mlle","Mme","Sir","the Countess",]
62
+ titanic_train["honorific"]=titanic_train["Name"].map(lambda x: x.split(",")[1].split(".")[0])
63
+ train_omit1=titanic_train[~titanic_train["honorific"].isin(only_train_honorific)].reset_index(drop=True)
64
+ print(titanic_train["honorific"].value_counts())
65
+ print(train_omit1["honorific"].value_counts())
66
+ ```
67
+ print結果
68
+ ```Python3
69
+ Mr 517
70
+ Miss 182
71
+ Mrs 125
72
+ Master 40
73
+ Dr 7
74
+ Rev 6
75
+ Col 2
76
+ Mlle 2
77
+ Major 2
78
+ Jonkheer 1
79
+ Ms 1
80
+ Don 1
81
+ Sir 1
82
+ Lady 1
83
+ Capt 1
84
+ the Countess 1
85
+ Mme 1
86
+ Name: honorific, dtype: int64
87
+ Mr 517
88
+ Miss 182
89
+ Mrs 125
90
+ Master 40
91
+ Dr 7
92
+ Rev 6
93
+ Col 2
94
+ Mlle 2
95
+ Major 2
96
+ Jonkheer 1
97
+ Ms 1
98
+ Don 1
99
+ Sir 1
100
+ Lady 1
101
+ Capt 1
102
+ the Countess 1
103
+ Mme 1
104
+ Name: honorific, dtype: int64
54
105
  ```

1

誤記載のため

2020/04/09 12:21

投稿

yukicb
yukicb

スコア21

title CHANGED
File without changes
body CHANGED
@@ -1,8 +1,8 @@
1
1
  ### 前提・実現したいこと
2
2
 
3
3
  MacでVSCode(Python3)を利用しています。
4
- isinを利用して、指定(下記only_train_honorific)項目のみを抽出したいのですが、全ての項目が入ったデータで抽出されてしまます。(発生している問題・エラーメッセージの「honorific」項目参照)
4
+ isinを利用して、指定(下記only_train_honorific)項目以外を抽出したいのですが、全ての項目が入ったデータで抽出されてしまます。(発生している問題・エラーメッセージの「honorific」項目参照)
5
- 指定の部分のみを抽出する方法をお分かりの方が入れば、ご教示いただけますと幸いです。
5
+ 上記、、原因がお分かりの方が入れば、ご教示いただけますと幸いです。
6
6
 
7
7
 
8
8
  ### 発生している問題・エラーメッセージ