質問編集履歴

6

HTML内img部分の更新

2020/01/27 06:00

投稿

LBciel.
LBciel.

スコア18

test CHANGED
File without changes
test CHANGED
@@ -14,7 +14,7 @@
14
14
 
15
15
    ▾<div class="img">
16
16
 
17
- <img src="https://...jpg?"
17
+ <img src="https://...jpg?" Srcset="https://...jpg? x1, https://...jpg? x2">
18
18
 
19
19
  </div>
20
20
 

5

下部コメント編集

2020/01/27 06:00

投稿

LBciel.
LBciel.

スコア18

test CHANGED
File without changes
test CHANGED
@@ -244,4 +244,8 @@
244
244
 
245
245
 
246
246
 
247
- 又、単体とコレクションがあるという事だけしか理解出来ていません。使い方がサイトのHTMLの条件次第ということもHTMLを使用したことがあるため理解しています。これ使えそう!と思ってもそれを使うための技術が無く、根本的にそこからでは出来ないのか出来るのかがわからないのも悩みの種になっています。
247
+ 単体とコレクションがあるという事だけしか理解出来ていません。使い方がサイトのHTMLの条件次第ということもHTMLを使用したことがあるため理解しています。これ使えそう!と思ってもそれを使うための技術が無く、根本的にそこからでは出来ないのか出来るのかがわからないのも悩みの種になっています。
248
+
249
+
250
+
251
+ 又、ログインが必要なサイトでログインが必要な事は理解できます。ログインするプログラムを作る際、ログインをしているかどうかの確認が必須だと考えております。調べてみたところcookieを利用する等の情報はあるものの詳細が御座いません。下手にログインも含めたプログラムは組まないほうが良いのでしょうか。

4

<a>タグの中に欲しい情報が全て収まっており、ブラウザ上は横並びで一行になっています。

2020/01/26 14:45

投稿

LBciel.
LBciel.

スコア18

test CHANGED
File without changes
test CHANGED
@@ -74,7 +74,9 @@
74
74
 
75
75
 
76
76
 
77
- <a>タグの中に欲しい情報が全て収まっており、ブラウザ上は横一並んでいます。
77
+ <a>タグの中に欲しい情報が全て収まっており、ブラウザ上は横並びでなっています。
78
+
79
+ <a>タグ1つが1行で、その下URL2,3,4…と下に続いています。その全てをページを変えて抽出が目標となっております。
78
80
 
79
81
 
80
82
 

3

下部コメント編集

2020/01/26 14:27

投稿

LBciel.
LBciel.

スコア18

test CHANGED
File without changes
test CHANGED
@@ -228,9 +228,13 @@
228
228
 
229
229
  anchor部分は現状試しているもののエラーで動かない部分です。
230
230
 
231
+
232
+
231
233
  ### 出来れば切に希望する教えて頂きたい事
232
234
 
233
- スクレイピングの抽出の流れは外堀から考えていく事だと思うのですが、その方法が全く理解出来ていません。こちらを作成後、今度はPythonでスクレイピングを行う予定ですので、考え方を理解したいと考えております。
235
+ スクレイピングの抽出の流れは外堀から考えていく事だと思うのですが、その方法が全く理解出来ていません。
236
+
237
+ こちらを作成後、今度はPythonでスクレイピングを行う予定ですので、考え方を理解したいと考えております。(IEでの操作で対象サイトのドロップダウンするものをクリックしても反映されない等あり、Pythonでの習得も考えております。)
234
238
 
235
239
 
236
240
 

2

修正依頼更新

2020/01/26 14:12

投稿

LBciel.
LBciel.

スコア18

test CHANGED
File without changes
test CHANGED
@@ -4,7 +4,7 @@
4
4
 
5
5
  下記対象サイト
6
6
 
7
- ```ここに言語を入力
7
+ ```HTML
8
8
 
9
9
 
10
10
 
@@ -88,7 +88,145 @@
88
88
 
89
89
  InputBox → ワード入力 → IE起動 → ログインページ → ID・pass入力 → 検索エンジンのあるURLに移動 → 検索エンジンにワード入力 → 検索ページに移動 + 次のページをクリック
90
90
 
91
-
91
+ ```Excel
92
+
93
+ Sub Wait(ByVal objIE As InternetExplorer)
94
+
95
+ ' Dim Lc As Integer
96
+
97
+ Do While objIE.Busy = True Or objIE.readyState < READYSTATE_COMPLETE
98
+
99
+ DoEvents
100
+
101
+ Loop
102
+
103
+
104
+
105
+ ' IE表示待ち(たまに抜けない場合もあるので1万回ループで強制抜け)
106
+
107
+ ' Lc = 0
108
+
109
+ ' Do While objIE.Busy = True Or objIE.readyState <> 4 Or Lc > 10000
110
+
111
+ ' DoEvents
112
+
113
+ ' Lc = Lc + 1
114
+
115
+ ' Loop
116
+
117
+
118
+
119
+ End Sub
120
+
121
+
122
+
123
+ Sub ログイン() '「ツール」「参照設定」「Microsoft HTML Object Library」「Microsoft Internet Controls」忘れずに
124
+
125
+
126
+
127
+ Dim keyword As String
128
+
129
+ keyword = InputBox("検索したいワードを入力してください。")
130
+
131
+
132
+
133
+ Dim objIE As InternetExplorer '操作するIEを入れる「箱」つまりオブジェクト変数を準備
134
+
135
+ Set objIE = New InternetExplorer '箱に新しいIEをセット
136
+
137
+
138
+
139
+ objIE.Visible = True 'IEを画面に表示する
140
+
141
+ objIE.navigate "https://s.com/login/home/?goto=" '管理画面ページのURLを指定
142
+
143
+ Wait objIE
144
+
145
+
146
+
147
+ Dim htmlDoc As HTMLDocument 'HTMLDocumentというHTMLドキュメントを表すオブジェクト
148
+
149
+ Set htmlDoc = objIE.document 'InternetExplorerオブジェクトのDocumentプロパティ
150
+
151
+
152
+
153
+ With htmlDoc
154
+
155
+ .getElementById("AccountName").Value = "ЖЖЖ" 'ユーザー名を指定
156
+
157
+ .getElementById("Password").Value = "ЖЖЖ" 'パスワードを指定
158
+
159
+ .getElementById("Login").Click
160
+
161
+ End With
162
+
163
+ Wait objIE
164
+
165
+
166
+
167
+ objIE.navigate "https://s.com/search/" '検索エンジンのあるページへのURLを指定
168
+
169
+ Wait objIE
170
+
171
+
172
+
173
+ With htmlDoc
174
+
175
+ .getElementById("store_nav_search").Value = keyword
176
+
177
+ .getElementById("store_search_link").Click
178
+
179
+ End With
180
+
181
+ Wait objIE
182
+
183
+
184
+
185
+ ' Dim page As Long
186
+
187
+ ' For page = 1 To 5
188
+
189
+ ' Wait objIE
190
+
191
+ ' Set htmlDoc = objIE.document
192
+
193
+
194
+
195
+ Dim anchor As HTMLAnchorElement
196
+
197
+ With htmlDoc
198
+
199
+ .getElementById("search_resultsRows").Links
200
+
201
+ Debug.Print anchor.href
202
+
203
+ End With
204
+
205
+
206
+
207
+ ' With htmlDoc
208
+
209
+ ' .getElementsByClassName("pagebtn")(0).Click
210
+
211
+ ' End With
212
+
213
+ ' Wait objIE
214
+
215
+
216
+
217
+ ' Next page
218
+
219
+
220
+
221
+ End Sub
222
+
223
+ ```
224
+
225
+ ※サイトを参考に「これで動いた」程度の理解状況です。使用したものを完璧に理解しているわけでは御座いません。
226
+
227
+ コメント部分の半端なプログラムは、後々使うであろうものを残しています。
228
+
229
+ anchor部分は現状試しているもののエラーで動かない部分です。
92
230
 
93
231
  ### 出来れば切に希望する教えて頂きたい事
94
232
 

1

更新

2020/01/26 14:02

投稿

LBciel.
LBciel.

スコア18

test CHANGED
File without changes
test CHANGED
@@ -1,6 +1,6 @@
1
1
  ### やりたい事
2
2
 
3
- **【URL】【画像】【商品名】【発売日】【値段】**を抜き出してExcelに入力する。
3
+ **【URL】【画像】【商品名】【発売日】【値段】**を抜き出してExcel2016に入力する。
4
4
 
5
5
  下記対象サイト
6
6