質問編集履歴

2

内容の修正

2020/10/07 18:15

投稿

Ik1BHt70kPY1wOD
Ik1BHt70kPY1wOD

スコア3

test CHANGED
File without changes
test CHANGED
@@ -4,9 +4,37 @@
4
4
 
5
5
 
6
6
 
7
- データサイエンス100本ノック構造化データ編を始めようとしいるプログラミング初心者です。
7
+ データサイエンス100本ノックの環境築についの質問です。
8
8
 
9
+ 詳細:
10
+
11
+ https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess/blob/master/README.md
12
+
13
+
14
+
15
+ MacでDocker Desktopを使用して上記を実践しようとしています。
16
+
17
+
18
+
19
+ ターミナルにて
20
+
21
+ ・git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess
22
+
23
+ ・cd 100knocks-preprocess
24
+
25
+ ・docker-compose up -d --build
26
+
9
- Docker DesktopでデータダウンロードしてJupyter Labで最初のセルを実行したところ、以下のようエラーメッセージが表示されました。解決法を教えていただけませんか。→問題のあるコードの範囲を絞ってから再投稿しようと思います。
27
+ を順に行い、localhost:8888開くとJupyter Labが表示され、ファイルも存在するのすが、最初のセルを実行しようとするとエラーが表示されます。
28
+
29
+
30
+
31
+ ガイドを確認し、Docker Desktopの共有設定に問題があるのかと思い、Preferences → Resources → FILE SHARING から /Users/(自分のユーザー名)/100knocks-preprocess を追加しましたが、やはり以下のようなエラーメッセージが表示されます。エラーの解決法を教えていただきたきたいです。
32
+
33
+
34
+
35
+ ガイド:
36
+
37
+ https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess/blob/master/docker/doc/100knocks_guide.pdf
10
38
 
11
39
 
12
40
 
@@ -17,92 +45,6 @@
17
45
 
18
46
 
19
47
  ```
20
-
21
- ---------------------------------------------------------------------------
22
-
23
- UndefinedTable Traceback (most recent call last)
24
-
25
- /opt/conda/lib/python3.8/site-packages/pandas/io/sql.py in execute(self, *args, **kwargs)
26
-
27
- 1680 try:
28
-
29
- -> 1681 cur.execute(*args, **kwargs)
30
-
31
- 1682 return cur
32
-
33
-
34
-
35
- UndefinedTable: relation "customer" does not exist
36
-
37
- LINE 1: select * from customer
38
-
39
- ^
40
-
41
-
42
-
43
-
44
-
45
- The above exception was the direct cause of the following exception:
46
-
47
-
48
-
49
- DatabaseError Traceback (most recent call last)
50
-
51
- <ipython-input-2-8ae959333cf8> in <module>
52
-
53
- 28 get_ipython().run_line_magic('sql', '$dsl')
54
-
55
- 29
56
-
57
- ---> 30 df_customer = pd.read_sql(sql='select * from customer', con=conn)
58
-
59
- 31 df_category = pd.read_sql(sql='select * from category', con=conn)
60
-
61
- 32 df_product = pd.read_sql(sql='select * from product', con=conn)
62
-
63
-
64
-
65
- /opt/conda/lib/python3.8/site-packages/pandas/io/sql.py in read_sql(sql, con, index_col, coerce_float, params, parse_dates, columns, chunksize)
66
-
67
- 481
68
-
69
- 482 if isinstance(pandas_sql, SQLiteDatabase):
70
-
71
- --> 483 return pandas_sql.read_query(
72
-
73
- 484 sql,
74
-
75
- 485 index_col=index_col,
76
-
77
-
78
-
79
- /opt/conda/lib/python3.8/site-packages/pandas/io/sql.py in read_query(self, sql, index_col, coerce_float, params, parse_dates, chunksize)
80
-
81
- 1725
82
-
83
- 1726 args = _convert_params(sql, params)
84
-
85
- -> 1727 cursor = self.execute(*args)
86
-
87
- 1728 columns = [col_desc[0] for col_desc in cursor.description]
88
-
89
- 1729
90
-
91
-
92
-
93
- /opt/conda/lib/python3.8/site-packages/pandas/io/sql.py in execute(self, *args, **kwargs)
94
-
95
- 1691
96
-
97
- 1692 ex = DatabaseError(f"Execution failed on sql '{args[0]}': {exc}")
98
-
99
- -> 1693 raise ex from exc
100
-
101
- 1694
102
-
103
- 1695 @staticmethod
104
-
105
-
106
48
 
107
49
  DatabaseError: Execution failed on sql 'select * from customer': relation "customer" does not exist
108
50
 
@@ -120,16 +62,4 @@
120
62
 
121
63
  ```
122
64
 
123
-
124
-
125
- ### 試したこと
65
+ ```
126
-
127
-
128
-
129
- Docker Desktopの共有設定ができていないのが原因かと思い、100本ノックファイル群を格納したディレクトリを共有しましたが、エラーメッセージは変わりません。
130
-
131
- ### 補足情報(FW/ツールのバージョンなど)
132
-
133
-
134
-
135
- ここにより詳細な情報を記載してください。

1

2020/10/07 18:15

投稿

Ik1BHt70kPY1wOD
Ik1BHt70kPY1wOD

スコア3

test CHANGED
File without changes
test CHANGED
@@ -6,7 +6,9 @@
6
6
 
7
7
  データサイエンス100本ノック構造化データ編を始めようとしているプログラミング初心者です。
8
8
 
9
- Docker DesktopでデータをダウンロードしてJupyter Labで最初のセルを実行したところ、以下のようなエラーメッセージが表示されました。解決法を教えていただけませんか。
9
+ Docker DesktopでデータをダウンロードしてJupyter Labで最初のセルを実行したところ、以下のようなエラーメッセージが表示されました。解決法を教えていただけませんか。→問題のあるコードの範囲を絞ってから再投稿しようと思います。
10
+
11
+
10
12
 
11
13
 
12
14
 
@@ -116,78 +118,6 @@
116
118
 
117
119
 
118
120
 
119
- ```python
120
-
121
- %load_ext sql
122
-
123
- import os
124
-
125
- import pandas as pd
126
-
127
- import numpy as np
128
-
129
- from datetime import datetime, date
130
-
131
- from dateutil.relativedelta import relativedelta
132
-
133
- import math
134
-
135
- import psycopg2
136
-
137
- from sqlalchemy import create_engine
138
-
139
- from sklearn import preprocessing
140
-
141
- from sklearn.model_selection import train_test_split
142
-
143
- from imblearn.under_sampling import RandomUnderSampler
144
-
145
-
146
-
147
- pgconfig = {
148
-
149
- 'host': 'db',
150
-
151
- 'port': os.environ['PG_PORT'],
152
-
153
- 'database': os.environ['PG_DATABASE'],
154
-
155
- 'user': os.environ['PG_USER'],
156
-
157
- 'password': os.environ['PG_PASSWORD'],
158
-
159
- }
160
-
161
- dsl = 'postgresql://{user}:{password}@{host}:{port}/{database}'.format(**pgconfig)
162
-
163
-
164
-
165
- # pd.read_sql用のコネクタ
166
-
167
- conn = psycopg2.connect(**pgconfig)
168
-
169
- # pd.to_sql用のcreate engine
170
-
171
- engine = create_engine(dsl)
172
-
173
- # MagicコマンドでSQLを書くための設定
174
-
175
- %sql $dsl
176
-
177
-
178
-
179
- df_customer = pd.read_sql(sql='select * from customer', con=conn)
180
-
181
- df_category = pd.read_sql(sql='select * from category', con=conn)
182
-
183
- df_product = pd.read_sql(sql='select * from product', con=conn)
184
-
185
- df_receipt = pd.read_sql(sql='select * from receipt', con=conn)
186
-
187
- df_store = pd.read_sql(sql='select * from store', con=conn)
188
-
189
- df_geocode = pd.read_sql(sql='select * from geocode', con=conn)
190
-
191
121
  ```
192
122
 
193
123
 
@@ -198,8 +128,6 @@
198
128
 
199
129
  Docker Desktopの共有設定ができていないのが原因かと思い、100本ノックファイル群を格納したディレクトリを共有しましたが、エラーメッセージは変わりません。
200
130
 
201
-
202
-
203
131
  ### 補足情報(FW/ツールのバージョンなど)
204
132
 
205
133