質問編集履歴

listとnumpy配列の違い追記

2018/09/17 07:44

投稿

Yukiya025

スコア86

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -130,4 +130,7 @@
 参考サイト:[Pandasのデータを格納するオブジェクトDataFrameを理解する -DeepAge](https://deepage.net/features/pandas-dataframe.html)
 **NumPy配列 (N-dimensional array/ndarray) **は同じ型&サイズの項目で構成する固定長の多次元コンテナ。
-参考サイト: [The N-dimensional array (ndarray)](https://docs.scipy.org/doc/numpy/reference/arrays.ndarray.html)
+参考サイト: [The N-dimensional array (ndarray)](https://docs.scipy.org/doc/numpy/reference/arrays.ndarray.html)
+## listとnumpy配列の違い
+[この質問&回答](https://teratail.com/questions/73677)を参照。

317

list、データフレーム、numpy配列などの使い分け

2018/09/17 07:44

投稿

Yukiya025

スコア86

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -116,4 +116,18 @@
 print('Dummy X Y: ', data1_xy_dummy, '\n')
 data1_dummy.head()
-```
+```
+# list、データフレーム、numpy配列などの使い分け
+**Pythonの組込関数であるリスト([オブジェクト1, オブジェクト2, ...])**は、要素としてあらゆるオブジェクトを持つことが可能。
+→複数のオブジェクトをまとめて管理。
+参考サイト: [リストオブジェクト -PythonWeb](https://www.pythonweb.jp/tutorial/list/index1.html)
+**Pandasのデータを格納するオブジェクトDataFrame**は、二次元配列に相当する。Seriesをラベリングしてディクショナリのように寄せ集めるとDataFrameになる。行と列のある表みたいな感じ。
+DataFrameオブジェクトのdata部分を指定するには、NumPyの配列・Seriesを含む辞書などが使える。データ部分の指定方法は多岐にわたる。
+ちなみに一次元配列はSeries。
+参考サイト:[Pandasのデータを格納するオブジェクトDataFrameを理解する -DeepAge](https://deepage.net/features/pandas-dataframe.html)
+**NumPy配列 (N-dimensional array/ndarray) **は同じ型&サイズの項目で構成する固定長の多次元コンテナ。
+参考サイト: [The N-dimensional array (ndarray)](https://docs.scipy.org/doc/numpy/reference/arrays.ndarray.html)

317

# Target = ['Survived'] としているコード周辺

2018/09/17 07:35

投稿

Yukiya025

スコア86

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -86,4 +86,34 @@
 C:\Users\ayumusato\Anaconda3\lib\site-packages\sklearn\model_selection\_validation.py:458: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples,), for example using ravel().
   estimator.fit(X_train, y_train, **fit_params)
 C:\Users\ayumusato\Anaconda3\lib\site-packages\ipykernel_launcher.py:56: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples,), for example using ravel().
+```
+# Target = ['Survived'] としているコード周辺
+```python
+label = LabelEncoder()
+for dataset in data_cleaner:
+    dataset['Sex_Code'] = label.fit_transform(dataset['Sex'])
+    dataset['Embarked_Code'] = label.fit_transform(dataset['Embarked'])
+    dataset['Title_Code'] = label.fit_transform(dataset['Title'])
+    dataset['AgeBin_Code'] = label.fit_transform(dataset['AgeBin'])
+    dataset['FareBin_Code'] = label.fit_transform(dataset['FareBin'])
+Target = ['Survived'] #←ここ
+data1_x = ['Sex', 'Pclass', 'Embarked', 'Title', 'SibSp', 'Parch', 'Age', 'Fare', 'FamilySize', 'IsAlone']
+data1_x_calc = ['Sex_Code', 'Pclass', 'Embarked_Code', 'Title_Code', 'SibSp', 'Parch', 'Age', 'Fare']
+data1_xy = Target + data1_x #←ここ
+print('Original X Y: ', data1_xy, '\n')
+data1_x_bin = ['Sex_Code', 'Pclass', 'Embarked_Code', 'Title_Code', 'FamilySize', 'AgeBin_Code', 'FareBin_Code']
+data1_xy_bin = Target + data1_x_bin
+print('Bin X Y: ', data1_xy_bin, '\n')
+data1_dummy = pd.get_dummies(data1[data1_x])
+data1_x_dummy = data1_dummy.columns.tolist()
+data1_xy_dummy = Target + data1_x_dummy
+print('Dummy X Y: ', data1_xy_dummy, '\n')
+data1_dummy.head()
 ```

317