質問編集履歴
4
衍字の訂正
test
CHANGED
File without changes
|
test
CHANGED
@@ -92,7 +92,7 @@
|
|
92
92
|
|
93
93
|
更に、次に進もうと、
|
94
94
|
|
95
|
-
/html/body/div[3]/div[8]//div//div
|
95
|
+
/html/body/div[3]/div[8]//div//div (または//div)
|
96
96
|
|
97
97
|
の時点でError:コンテンツが空と出ます。
|
98
98
|
|
3
見た目の改善
test
CHANGED
File without changes
|
test
CHANGED
@@ -16,7 +16,9 @@
|
|
16
16
|
|
17
17
|
|
18
18
|
|
19
|
+
|
20
|
+
|
19
|
-
#
|
21
|
+
# 該当のソースコード
|
20
22
|
|
21
23
|
|
22
24
|
|
@@ -24,21 +26,9 @@
|
|
24
26
|
|
25
27
|
ブランド名 E---
|
26
28
|
|
27
|
-
商品名 C--------(略)-------
|
29
|
+
商品名 C--------(略)------- ←今回はココ
|
28
30
|
|
29
31
|
値段:
|
30
|
-
|
31
|
-
|
32
|
-
|
33
|
-
```
|
34
|
-
|
35
|
-
結果:Error:インポートしたコンテンツが空です。
|
36
|
-
|
37
|
-
```
|
38
|
-
|
39
|
-
|
40
|
-
|
41
|
-
# 該当のソースコード
|
42
32
|
|
43
33
|
|
44
34
|
|
@@ -55,6 +45,22 @@
|
|
55
45
|
,"/html/body/div[3]/div[8]/div/div[2]/div/div[2]/span[2]/span[2]")
|
56
46
|
|
57
47
|
```
|
48
|
+
|
49
|
+
|
50
|
+
|
51
|
+
# 発生している問題・エラーメッセージ
|
52
|
+
|
53
|
+
|
54
|
+
|
55
|
+
|
56
|
+
|
57
|
+
```
|
58
|
+
|
59
|
+
結果:Error:インポートしたコンテンツが空です。
|
60
|
+
|
61
|
+
```
|
62
|
+
|
63
|
+
|
58
64
|
|
59
65
|
|
60
66
|
|
@@ -136,7 +142,11 @@
|
|
136
142
|
|
137
143
|
/html/body/div[3]/div[8]/div/div[2]/div
|
138
144
|
|
145
|
+
```
|
146
|
+
|
139
147
|
が以下になりました。
|
148
|
+
|
149
|
+
```
|
140
150
|
|
141
151
|
/descendant::*[local-name() = "/html/body/div/div/div/div/div" or local-name() = "/HTML/BODY/DIV/DIV/DIV/DIV/DIV"][(@3) and (@8) and (@2)]"
|
142
152
|
|
2
試した事の追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -119,3 +119,37 @@
|
|
119
119
|
|
120
120
|
|
121
121
|
※Seleniumが楽と多々見るので、これから触ってみたいと思います。
|
122
|
+
|
123
|
+
|
124
|
+
|
125
|
+
|
126
|
+
|
127
|
+
【追記】
|
128
|
+
|
129
|
+
CSS セレクタをXPathに変換する(サイト下部)
|
130
|
+
|
131
|
+
https://piro.sakura.ne.jp/latest/blosxom/mozilla/xul/2007-09-13_selector-to-xpath.htm
|
132
|
+
|
133
|
+
を見つけて変換した所、
|
134
|
+
|
135
|
+
```
|
136
|
+
|
137
|
+
/html/body/div[3]/div[8]/div/div[2]/div
|
138
|
+
|
139
|
+
が以下になりました。
|
140
|
+
|
141
|
+
/descendant::*[local-name() = "/html/body/div/div/div/div/div" or local-name() = "/HTML/BODY/DIV/DIV/DIV/DIV/DIV"][(@3) and (@8) and (@2)]"
|
142
|
+
|
143
|
+
```
|
144
|
+
|
145
|
+
そのまま打ち込むと"(ダブルコーテーション)云々でバグったので一旦別のセルに入れて参照した所機能しました。
|
146
|
+
|
147
|
+
|
148
|
+
|
149
|
+
この状態で参照すると「URLが参照できません」と出ます。
|
150
|
+
|
151
|
+
同じ内容をURLを打ち込むと出来るんですが、参照できないらしいですね。
|
152
|
+
|
153
|
+
|
154
|
+
|
155
|
+
なお、 最後に「/h2」があると内部インポートエラーになりました。
|
1
誤字脱字の修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -2,13 +2,11 @@
|
|
2
2
|
|
3
3
|
|
4
4
|
|
5
|
-
|
6
|
-
|
7
|
-
|
5
|
+
どうやっても取得できないXPathがあったので、取得の方法を知りたく質問しました。
|
8
6
|
|
9
7
|
|
10
8
|
|
11
|
-
|
9
|
+
目的:スプレットシートのimportXML関数(XPath)を利用し、データを抽出する
|
12
10
|
|
13
11
|
|
14
12
|
|
@@ -44,9 +42,17 @@
|
|
44
42
|
|
45
43
|
|
46
44
|
|
47
|
-
|
45
|
+
右クリックから取得したXPathは以下となります。
|
48
46
|
|
49
47
|
/html/body/div[3]/div[8]/div/div[2]/div/div[2]/span[2]/span[2]
|
48
|
+
|
49
|
+
|
50
|
+
|
51
|
+
```ソースコード
|
52
|
+
|
53
|
+
=importXML("https://www.julian-fashion.com/en-US/product/120833/etro/beachwear/coulisse_swimshorts"
|
54
|
+
|
55
|
+
,"/html/body/div[3]/div[8]/div/div[2]/div/div[2]/span[2]/span[2]")
|
50
56
|
|
51
57
|
```
|
52
58
|
|
@@ -54,25 +60,33 @@
|
|
54
60
|
|
55
61
|
# 試したこと
|
56
62
|
|
63
|
+
pathを右から削って検証した所、
|
64
|
+
|
65
|
+
/html/body/div[3]/div[8]まで表示出来ました。
|
66
|
+
|
67
|
+
過去のログを見た所、このようなコメントがあったので、
|
68
|
+
|
69
|
+
|
70
|
+
|
57
71
|
>chromeのcopy xpathには対応していない
|
58
72
|
|
59
|
-
/を//に変えれば大体いけますけどね。
|
73
|
+
>/を//に変えれば大体いけますけどね。
|
60
74
|
|
61
|
-
過去のログを見た所、このようなコメントがあったので、pathを右から削って検証した所、
|
62
75
|
|
63
|
-
/html/body/div[3]/div[8]まで表示出来ました。
|
64
76
|
|
65
77
|
ので、スラッシュを増やして入力した所、
|
66
78
|
|
67
79
|
/html/body/div[3]/div[8]//div
|
68
80
|
|
69
|
-
で
|
81
|
+
まで取得出来ました。
|
82
|
+
|
83
|
+
|
70
84
|
|
71
85
|
ただ、ページのソースコード内に書いてない内容が返されて意味が分かりません。
|
72
86
|
|
73
87
|
更に、次に進もうと、
|
74
88
|
|
75
|
-
/html/body/div[3]/div[8]//div//div/div
|
89
|
+
/html/body/div[3]/div[8]//div//div/div (または//div)
|
76
90
|
|
77
91
|
の時点でError:コンテンツが空と出ます。
|
78
92
|
|