質問編集履歴
6
HTML内img部分の更新
test
CHANGED
File without changes
|
test
CHANGED
@@ -14,7 +14,7 @@
|
|
14
14
|
|
15
15
|
▾<div class="img">
|
16
16
|
|
17
|
-
<img src="https://...jpg?"
|
17
|
+
<img src="https://...jpg?" Srcset="https://...jpg? x1, https://...jpg? x2">
|
18
18
|
|
19
19
|
</div>
|
20
20
|
|
5
下部コメント編集
test
CHANGED
File without changes
|
test
CHANGED
@@ -244,4 +244,8 @@
|
|
244
244
|
|
245
245
|
|
246
246
|
|
247
|
-
|
247
|
+
単体とコレクションがあるという事だけしか理解出来ていません。使い方がサイトのHTMLの条件次第ということもHTMLを使用したことがあるため理解しています。これ使えそう!と思ってもそれを使うための技術が無く、根本的にそこからでは出来ないのか出来るのかがわからないのも悩みの種になっています。
|
248
|
+
|
249
|
+
|
250
|
+
|
251
|
+
又、ログインが必要なサイトでログインが必要な事は理解できます。ログインするプログラムを作る際、ログインをしているかどうかの確認が必須だと考えております。調べてみたところcookieを利用する等の情報はあるものの詳細が御座いません。下手にログインも含めたプログラムは組まないほうが良いのでしょうか。
|
4
<a>タグの中に欲しい情報が全て収まっており、ブラウザ上は横並びで一行になっています。
test
CHANGED
File without changes
|
test
CHANGED
@@ -74,7 +74,9 @@
|
|
74
74
|
|
75
75
|
|
76
76
|
|
77
|
-
<a>タグの中に欲しい情報が全て収まっており、ブラウザ上は横一
|
77
|
+
<a>タグの中に欲しい情報が全て収まっており、ブラウザ上は横並びで一行になっています。
|
78
|
+
|
79
|
+
<a>タグ1つが1行で、その下URL2,3,4…と下に続いています。その全てをページを変えて抽出が目標となっております。
|
78
80
|
|
79
81
|
|
80
82
|
|
3
下部コメント編集
test
CHANGED
File without changes
|
test
CHANGED
@@ -228,9 +228,13 @@
|
|
228
228
|
|
229
229
|
anchor部分は現状試しているもののエラーで動かない部分です。
|
230
230
|
|
231
|
+
|
232
|
+
|
231
233
|
### 出来れば切に希望する教えて頂きたい事
|
232
234
|
|
233
|
-
スクレイピングの抽出の流れは外堀から考えていく事だと思うのですが、その方法が全く理解出来ていません。
|
235
|
+
スクレイピングの抽出の流れは外堀から考えていく事だと思うのですが、その方法が全く理解出来ていません。
|
236
|
+
|
237
|
+
こちらを作成後、今度はPythonでスクレイピングを行う予定ですので、考え方を理解したいと考えております。(IEでの操作で対象サイトのドロップダウンするものをクリックしても反映されない等あり、Pythonでの習得も考えております。)
|
234
238
|
|
235
239
|
|
236
240
|
|
2
修正依頼更新
test
CHANGED
File without changes
|
test
CHANGED
@@ -4,7 +4,7 @@
|
|
4
4
|
|
5
5
|
下記対象サイト
|
6
6
|
|
7
|
-
```
|
7
|
+
```HTML
|
8
8
|
|
9
9
|
▾
|
10
10
|
|
@@ -88,7 +88,145 @@
|
|
88
88
|
|
89
89
|
InputBox → ワード入力 → IE起動 → ログインページ → ID・pass入力 → 検索エンジンのあるURLに移動 → 検索エンジンにワード入力 → 検索ページに移動 + 次のページをクリック
|
90
90
|
|
91
|
-
|
91
|
+
```Excel
|
92
|
+
|
93
|
+
Sub Wait(ByVal objIE As InternetExplorer)
|
94
|
+
|
95
|
+
' Dim Lc As Integer
|
96
|
+
|
97
|
+
Do While objIE.Busy = True Or objIE.readyState < READYSTATE_COMPLETE
|
98
|
+
|
99
|
+
DoEvents
|
100
|
+
|
101
|
+
Loop
|
102
|
+
|
103
|
+
|
104
|
+
|
105
|
+
' IE表示待ち(たまに抜けない場合もあるので1万回ループで強制抜け)
|
106
|
+
|
107
|
+
' Lc = 0
|
108
|
+
|
109
|
+
' Do While objIE.Busy = True Or objIE.readyState <> 4 Or Lc > 10000
|
110
|
+
|
111
|
+
' DoEvents
|
112
|
+
|
113
|
+
' Lc = Lc + 1
|
114
|
+
|
115
|
+
' Loop
|
116
|
+
|
117
|
+
|
118
|
+
|
119
|
+
End Sub
|
120
|
+
|
121
|
+
|
122
|
+
|
123
|
+
Sub ログイン() '「ツール」「参照設定」「Microsoft HTML Object Library」「Microsoft Internet Controls」忘れずに
|
124
|
+
|
125
|
+
|
126
|
+
|
127
|
+
Dim keyword As String
|
128
|
+
|
129
|
+
keyword = InputBox("検索したいワードを入力してください。")
|
130
|
+
|
131
|
+
|
132
|
+
|
133
|
+
Dim objIE As InternetExplorer '操作するIEを入れる「箱」つまりオブジェクト変数を準備
|
134
|
+
|
135
|
+
Set objIE = New InternetExplorer '箱に新しいIEをセット
|
136
|
+
|
137
|
+
|
138
|
+
|
139
|
+
objIE.Visible = True 'IEを画面に表示する
|
140
|
+
|
141
|
+
objIE.navigate "https://s.com/login/home/?goto=" '管理画面ページのURLを指定
|
142
|
+
|
143
|
+
Wait objIE
|
144
|
+
|
145
|
+
|
146
|
+
|
147
|
+
Dim htmlDoc As HTMLDocument 'HTMLDocumentというHTMLドキュメントを表すオブジェクト
|
148
|
+
|
149
|
+
Set htmlDoc = objIE.document 'InternetExplorerオブジェクトのDocumentプロパティ
|
150
|
+
|
151
|
+
|
152
|
+
|
153
|
+
With htmlDoc
|
154
|
+
|
155
|
+
.getElementById("AccountName").Value = "ЖЖЖ" 'ユーザー名を指定
|
156
|
+
|
157
|
+
.getElementById("Password").Value = "ЖЖЖ" 'パスワードを指定
|
158
|
+
|
159
|
+
.getElementById("Login").Click
|
160
|
+
|
161
|
+
End With
|
162
|
+
|
163
|
+
Wait objIE
|
164
|
+
|
165
|
+
|
166
|
+
|
167
|
+
objIE.navigate "https://s.com/search/" '検索エンジンのあるページへのURLを指定
|
168
|
+
|
169
|
+
Wait objIE
|
170
|
+
|
171
|
+
|
172
|
+
|
173
|
+
With htmlDoc
|
174
|
+
|
175
|
+
.getElementById("store_nav_search").Value = keyword
|
176
|
+
|
177
|
+
.getElementById("store_search_link").Click
|
178
|
+
|
179
|
+
End With
|
180
|
+
|
181
|
+
Wait objIE
|
182
|
+
|
183
|
+
|
184
|
+
|
185
|
+
' Dim page As Long
|
186
|
+
|
187
|
+
' For page = 1 To 5
|
188
|
+
|
189
|
+
' Wait objIE
|
190
|
+
|
191
|
+
' Set htmlDoc = objIE.document
|
192
|
+
|
193
|
+
|
194
|
+
|
195
|
+
Dim anchor As HTMLAnchorElement
|
196
|
+
|
197
|
+
With htmlDoc
|
198
|
+
|
199
|
+
.getElementById("search_resultsRows").Links
|
200
|
+
|
201
|
+
Debug.Print anchor.href
|
202
|
+
|
203
|
+
End With
|
204
|
+
|
205
|
+
|
206
|
+
|
207
|
+
' With htmlDoc
|
208
|
+
|
209
|
+
' .getElementsByClassName("pagebtn")(0).Click
|
210
|
+
|
211
|
+
' End With
|
212
|
+
|
213
|
+
' Wait objIE
|
214
|
+
|
215
|
+
|
216
|
+
|
217
|
+
' Next page
|
218
|
+
|
219
|
+
|
220
|
+
|
221
|
+
End Sub
|
222
|
+
|
223
|
+
```
|
224
|
+
|
225
|
+
※サイトを参考に「これで動いた」程度の理解状況です。使用したものを完璧に理解しているわけでは御座いません。
|
226
|
+
|
227
|
+
コメント部分の半端なプログラムは、後々使うであろうものを残しています。
|
228
|
+
|
229
|
+
anchor部分は現状試しているもののエラーで動かない部分です。
|
92
230
|
|
93
231
|
### 出来れば切に希望する教えて頂きたい事
|
94
232
|
|
1
更新
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,6 +1,6 @@
|
|
1
1
|
### やりたい事
|
2
2
|
|
3
|
-
**【URL】【画像】【商品名】【発売日】【値段】**を抜き出してExcelに入力する。
|
3
|
+
**【URL】【画像】【商品名】【発売日】【値段】**を抜き出してExcel2016に入力する。
|
4
4
|
|
5
5
|
下記対象サイト
|
6
6
|
|