質問編集履歴
3
listとnumpy配列の違い追記
title
CHANGED
File without changes
|
body
CHANGED
@@ -130,4 +130,7 @@
|
|
130
130
|
参考サイト:[Pandasのデータを格納するオブジェクトDataFrameを理解する -DeepAge](https://deepage.net/features/pandas-dataframe.html)
|
131
131
|
|
132
132
|
**NumPy配列 (N-dimensional array/ndarray) **は同じ型&サイズの項目で構成する固定長の多次元コンテナ。
|
133
|
-
参考サイト: [The N-dimensional array (ndarray)](https://docs.scipy.org/doc/numpy/reference/arrays.ndarray.html)
|
133
|
+
参考サイト: [The N-dimensional array (ndarray)](https://docs.scipy.org/doc/numpy/reference/arrays.ndarray.html)
|
134
|
+
|
135
|
+
## listとnumpy配列の違い
|
136
|
+
[この質問&回答](https://teratail.com/questions/73677)を参照。
|
2
list、データフレーム、numpy配列などの使い分け
title
CHANGED
File without changes
|
body
CHANGED
@@ -116,4 +116,18 @@
|
|
116
116
|
print('Dummy X Y: ', data1_xy_dummy, '\n')
|
117
117
|
|
118
118
|
data1_dummy.head()
|
119
|
-
```
|
119
|
+
```
|
120
|
+
|
121
|
+
# list、データフレーム、numpy配列などの使い分け
|
122
|
+
**Pythonの組込関数であるリスト([オブジェクト1, オブジェクト2, ...])**は、要素としてあらゆるオブジェクトを持つことが可能。
|
123
|
+
→複数のオブジェクトをまとめて管理。
|
124
|
+
参考サイト: [リストオブジェクト -PythonWeb](https://www.pythonweb.jp/tutorial/list/index1.html)
|
125
|
+
|
126
|
+
|
127
|
+
**Pandasのデータを格納するオブジェクトDataFrame**は、二次元配列に相当する。Seriesをラベリングしてディクショナリのように寄せ集めるとDataFrameになる。行と列のある表みたいな感じ。
|
128
|
+
DataFrameオブジェクトのdata部分を指定するには、NumPyの配列・Seriesを含む辞書などが使える。データ部分の指定方法は多岐にわたる。
|
129
|
+
ちなみに一次元配列はSeries。
|
130
|
+
参考サイト:[Pandasのデータを格納するオブジェクトDataFrameを理解する -DeepAge](https://deepage.net/features/pandas-dataframe.html)
|
131
|
+
|
132
|
+
**NumPy配列 (N-dimensional array/ndarray) **は同じ型&サイズの項目で構成する固定長の多次元コンテナ。
|
133
|
+
参考サイト: [The N-dimensional array (ndarray)](https://docs.scipy.org/doc/numpy/reference/arrays.ndarray.html)
|
1
# Target = ['Survived'] としているコード周辺
title
CHANGED
File without changes
|
body
CHANGED
@@ -86,4 +86,34 @@
|
|
86
86
|
C:\Users\ayumusato\Anaconda3\lib\site-packages\sklearn\model_selection\_validation.py:458: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples,), for example using ravel().
|
87
87
|
estimator.fit(X_train, y_train, **fit_params)
|
88
88
|
C:\Users\ayumusato\Anaconda3\lib\site-packages\ipykernel_launcher.py:56: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples,), for example using ravel().
|
89
|
+
```
|
90
|
+
|
91
|
+
# Target = ['Survived'] としているコード周辺
|
92
|
+
|
93
|
+
```python
|
94
|
+
label = LabelEncoder()
|
95
|
+
for dataset in data_cleaner:
|
96
|
+
dataset['Sex_Code'] = label.fit_transform(dataset['Sex'])
|
97
|
+
dataset['Embarked_Code'] = label.fit_transform(dataset['Embarked'])
|
98
|
+
dataset['Title_Code'] = label.fit_transform(dataset['Title'])
|
99
|
+
dataset['AgeBin_Code'] = label.fit_transform(dataset['AgeBin'])
|
100
|
+
dataset['FareBin_Code'] = label.fit_transform(dataset['FareBin'])
|
101
|
+
|
102
|
+
Target = ['Survived'] #←ここ
|
103
|
+
|
104
|
+
data1_x = ['Sex', 'Pclass', 'Embarked', 'Title', 'SibSp', 'Parch', 'Age', 'Fare', 'FamilySize', 'IsAlone']
|
105
|
+
data1_x_calc = ['Sex_Code', 'Pclass', 'Embarked_Code', 'Title_Code', 'SibSp', 'Parch', 'Age', 'Fare']
|
106
|
+
data1_xy = Target + data1_x #←ここ
|
107
|
+
print('Original X Y: ', data1_xy, '\n')
|
108
|
+
|
109
|
+
data1_x_bin = ['Sex_Code', 'Pclass', 'Embarked_Code', 'Title_Code', 'FamilySize', 'AgeBin_Code', 'FareBin_Code']
|
110
|
+
data1_xy_bin = Target + data1_x_bin
|
111
|
+
print('Bin X Y: ', data1_xy_bin, '\n')
|
112
|
+
|
113
|
+
data1_dummy = pd.get_dummies(data1[data1_x])
|
114
|
+
data1_x_dummy = data1_dummy.columns.tolist()
|
115
|
+
data1_xy_dummy = Target + data1_x_dummy
|
116
|
+
print('Dummy X Y: ', data1_xy_dummy, '\n')
|
117
|
+
|
118
|
+
data1_dummy.head()
|
89
119
|
```
|