質問編集履歴
1
全体構造を追記しました。
test
CHANGED
File without changes
|
test
CHANGED
@@ -127,3 +127,65 @@
|
|
127
127
|
どなたか少しでも情報いただけますと幸いです。
|
128
128
|
|
129
129
|
よろしくお願いいたします。
|
130
|
+
|
131
|
+
|
132
|
+
|
133
|
+
# 追記事項
|
134
|
+
|
135
|
+
HTMLを記載しましたが、requestsを使ってURLを取得しています。(記載しておらずすみません)
|
136
|
+
|
137
|
+
上記HTMLのURLを「https://xxx.com/xxx/xxx/12345」とします。
|
138
|
+
|
139
|
+
|
140
|
+
|
141
|
+
全体の流れとしては以下です
|
142
|
+
|
143
|
+
```Python
|
144
|
+
|
145
|
+
import gspread
|
146
|
+
|
147
|
+
import requests
|
148
|
+
|
149
|
+
from bs4 import BeautifulSoup
|
150
|
+
|
151
|
+
from oauth2client.service_account import ServiceAccountCredentials
|
152
|
+
|
153
|
+
import time
|
154
|
+
|
155
|
+
|
156
|
+
|
157
|
+
url = "https://xxx.com/xxx/xxx/12345"
|
158
|
+
|
159
|
+
r = requests.get(url)
|
160
|
+
|
161
|
+
soup = BeautifulSoup(r.text, 'lxml')
|
162
|
+
|
163
|
+
|
164
|
+
|
165
|
+
elements = soup.select('p.hyoka')
|
166
|
+
|
167
|
+
|
168
|
+
|
169
|
+
scope = ['省略','省略']
|
170
|
+
|
171
|
+
|
172
|
+
|
173
|
+
credentials = 省略
|
174
|
+
|
175
|
+
gc = gspread.authorize(credentials)
|
176
|
+
|
177
|
+
wks = gc.open('gspreadサンプル').sheet1
|
178
|
+
|
179
|
+
|
180
|
+
|
181
|
+
for index, e in enumerate(elements):
|
182
|
+
|
183
|
+
num = index+1
|
184
|
+
|
185
|
+
wks.update_acell('A'+str(num), e.get_text())
|
186
|
+
|
187
|
+
```
|
188
|
+
|
189
|
+
このURLの中が先ほど書いたHTMLです。(実在するサイトですが、class名のみ変えています)
|
190
|
+
|
191
|
+
これで行うと項目Aには「評価」という文字のみが入ってきます。
|