質問するログイン新規登録

質問編集履歴

3

listとnumpy配列の違い追記

2018/09/17 07:44

投稿

Yukiya025
Yukiya025

スコア86

title CHANGED
File without changes
body CHANGED
@@ -130,4 +130,7 @@
130
130
  参考サイト:[Pandasのデータを格納するオブジェクトDataFrameを理解する -DeepAge](https://deepage.net/features/pandas-dataframe.html)
131
131
 
132
132
  **NumPy配列 (N-dimensional array/ndarray) **は同じ型&サイズの項目で構成する固定長の多次元コンテナ。
133
- 参考サイト: [The N-dimensional array (ndarray)](https://docs.scipy.org/doc/numpy/reference/arrays.ndarray.html)
133
+ 参考サイト: [The N-dimensional array (ndarray)](https://docs.scipy.org/doc/numpy/reference/arrays.ndarray.html)
134
+
135
+ ## listとnumpy配列の違い
136
+ [この質問&回答](https://teratail.com/questions/73677)を参照。

2

list、データフレーム、numpy配列などの使い分け

2018/09/17 07:44

投稿

Yukiya025
Yukiya025

スコア86

title CHANGED
File without changes
body CHANGED
@@ -116,4 +116,18 @@
116
116
  print('Dummy X Y: ', data1_xy_dummy, '\n')
117
117
 
118
118
  data1_dummy.head()
119
- ```
119
+ ```
120
+
121
+ # list、データフレーム、numpy配列などの使い分け
122
+ **Pythonの組込関数であるリスト([オブジェクト1, オブジェクト2, ...])**は、要素としてあらゆるオブジェクトを持つことが可能。
123
+ →複数のオブジェクトをまとめて管理。
124
+ 参考サイト: [リストオブジェクト -PythonWeb](https://www.pythonweb.jp/tutorial/list/index1.html)
125
+
126
+
127
+ **Pandasのデータを格納するオブジェクトDataFrame**は、二次元配列に相当する。Seriesをラベリングしてディクショナリのように寄せ集めるとDataFrameになる。行と列のある表みたいな感じ。
128
+ DataFrameオブジェクトのdata部分を指定するには、NumPyの配列・Seriesを含む辞書などが使える。データ部分の指定方法は多岐にわたる。
129
+ ちなみに一次元配列はSeries。
130
+ 参考サイト:[Pandasのデータを格納するオブジェクトDataFrameを理解する -DeepAge](https://deepage.net/features/pandas-dataframe.html)
131
+
132
+ **NumPy配列 (N-dimensional array/ndarray) **は同じ型&サイズの項目で構成する固定長の多次元コンテナ。
133
+ 参考サイト: [The N-dimensional array (ndarray)](https://docs.scipy.org/doc/numpy/reference/arrays.ndarray.html)

1

# Target = ['Survived'] としているコード周辺

2018/09/17 07:35

投稿

Yukiya025
Yukiya025

スコア86

title CHANGED
File without changes
body CHANGED
@@ -86,4 +86,34 @@
86
86
  C:\Users\ayumusato\Anaconda3\lib\site-packages\sklearn\model_selection\_validation.py:458: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples,), for example using ravel().
87
87
  estimator.fit(X_train, y_train, **fit_params)
88
88
  C:\Users\ayumusato\Anaconda3\lib\site-packages\ipykernel_launcher.py:56: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples,), for example using ravel().
89
+ ```
90
+
91
+ # Target = ['Survived'] としているコード周辺
92
+
93
+ ```python
94
+ label = LabelEncoder()
95
+ for dataset in data_cleaner:
96
+ dataset['Sex_Code'] = label.fit_transform(dataset['Sex'])
97
+ dataset['Embarked_Code'] = label.fit_transform(dataset['Embarked'])
98
+ dataset['Title_Code'] = label.fit_transform(dataset['Title'])
99
+ dataset['AgeBin_Code'] = label.fit_transform(dataset['AgeBin'])
100
+ dataset['FareBin_Code'] = label.fit_transform(dataset['FareBin'])
101
+
102
+ Target = ['Survived'] #←ここ
103
+
104
+ data1_x = ['Sex', 'Pclass', 'Embarked', 'Title', 'SibSp', 'Parch', 'Age', 'Fare', 'FamilySize', 'IsAlone']
105
+ data1_x_calc = ['Sex_Code', 'Pclass', 'Embarked_Code', 'Title_Code', 'SibSp', 'Parch', 'Age', 'Fare']
106
+ data1_xy = Target + data1_x #←ここ
107
+ print('Original X Y: ', data1_xy, '\n')
108
+
109
+ data1_x_bin = ['Sex_Code', 'Pclass', 'Embarked_Code', 'Title_Code', 'FamilySize', 'AgeBin_Code', 'FareBin_Code']
110
+ data1_xy_bin = Target + data1_x_bin
111
+ print('Bin X Y: ', data1_xy_bin, '\n')
112
+
113
+ data1_dummy = pd.get_dummies(data1[data1_x])
114
+ data1_x_dummy = data1_dummy.columns.tolist()
115
+ data1_xy_dummy = Target + data1_x_dummy
116
+ print('Dummy X Y: ', data1_xy_dummy, '\n')
117
+
118
+ data1_dummy.head()
89
119
  ```