質問編集履歴
4
衍字の訂正
title
CHANGED
File without changes
|
body
CHANGED
@@ -45,7 +45,7 @@
|
|
45
45
|
|
46
46
|
ただ、ページのソースコード内に書いてない内容が返されて意味が分かりません。
|
47
47
|
更に、次に進もうと、
|
48
|
-
/html/body/div[3]/div[8]//div//div
|
48
|
+
/html/body/div[3]/div[8]//div//div (または//div)
|
49
49
|
の時点でError:コンテンツが空と出ます。
|
50
50
|
どういうことなのでしょうか?
|
51
51
|
|
3
見た目の改善
title
CHANGED
File without changes
|
body
CHANGED
@@ -7,19 +7,14 @@
|
|
7
7
|
サイト
|
8
8
|
https://www.julian-fashion.com/en-US/product/120833/etro/beachwear/coulisse_swimshorts
|
9
9
|
|
10
|
-
# 発生している問題・エラーメッセージ
|
11
10
|
|
11
|
+
# 該当のソースコード
|
12
|
+
|
12
13
|
抜きたい情報がサイト内のこの部分で
|
13
14
|
ブランド名 E---
|
14
|
-
商品名 C--------(略)-------
|
15
|
+
商品名 C--------(略)------- ←今回はココ
|
15
16
|
値段:
|
16
17
|
|
17
|
-
```
|
18
|
-
結果:Error:インポートしたコンテンツが空です。
|
19
|
-
```
|
20
|
-
|
21
|
-
# 該当のソースコード
|
22
|
-
|
23
18
|
右クリックから取得したXPathは以下となります。
|
24
19
|
/html/body/div[3]/div[8]/div/div[2]/div/div[2]/span[2]/span[2]
|
25
20
|
|
@@ -28,6 +23,14 @@
|
|
28
23
|
,"/html/body/div[3]/div[8]/div/div[2]/div/div[2]/span[2]/span[2]")
|
29
24
|
```
|
30
25
|
|
26
|
+
# 発生している問題・エラーメッセージ
|
27
|
+
|
28
|
+
|
29
|
+
```
|
30
|
+
結果:Error:インポートしたコンテンツが空です。
|
31
|
+
```
|
32
|
+
|
33
|
+
|
31
34
|
# 試したこと
|
32
35
|
pathを右から削って検証した所、
|
33
36
|
/html/body/div[3]/div[8]まで表示出来ました。
|
@@ -67,7 +70,9 @@
|
|
67
70
|
を見つけて変換した所、
|
68
71
|
```
|
69
72
|
/html/body/div[3]/div[8]/div/div[2]/div
|
73
|
+
```
|
70
74
|
が以下になりました。
|
75
|
+
```
|
71
76
|
/descendant::*[local-name() = "/html/body/div/div/div/div/div" or local-name() = "/HTML/BODY/DIV/DIV/DIV/DIV/DIV"][(@3) and (@8) and (@2)]"
|
72
77
|
```
|
73
78
|
そのまま打ち込むと"(ダブルコーテーション)云々でバグったので一旦別のセルに入れて参照した所機能しました。
|
2
試した事の追記
title
CHANGED
File without changes
|
body
CHANGED
@@ -58,4 +58,21 @@
|
|
58
58
|
|
59
59
|
有識者の方、よろしくお願いいたします。
|
60
60
|
|
61
|
-
※Seleniumが楽と多々見るので、これから触ってみたいと思います。
|
61
|
+
※Seleniumが楽と多々見るので、これから触ってみたいと思います。
|
62
|
+
|
63
|
+
|
64
|
+
【追記】
|
65
|
+
CSS セレクタをXPathに変換する(サイト下部)
|
66
|
+
https://piro.sakura.ne.jp/latest/blosxom/mozilla/xul/2007-09-13_selector-to-xpath.htm
|
67
|
+
を見つけて変換した所、
|
68
|
+
```
|
69
|
+
/html/body/div[3]/div[8]/div/div[2]/div
|
70
|
+
が以下になりました。
|
71
|
+
/descendant::*[local-name() = "/html/body/div/div/div/div/div" or local-name() = "/HTML/BODY/DIV/DIV/DIV/DIV/DIV"][(@3) and (@8) and (@2)]"
|
72
|
+
```
|
73
|
+
そのまま打ち込むと"(ダブルコーテーション)云々でバグったので一旦別のセルに入れて参照した所機能しました。
|
74
|
+
|
75
|
+
この状態で参照すると「URLが参照できません」と出ます。
|
76
|
+
同じ内容をURLを打ち込むと出来るんですが、参照できないらしいですね。
|
77
|
+
|
78
|
+
なお、 最後に「/h2」があると内部インポートエラーになりました。
|
1
誤字脱字の修正
title
CHANGED
File without changes
|
body
CHANGED
@@ -1,10 +1,9 @@
|
|
1
1
|
# 前提・実現したいこと
|
2
2
|
|
3
|
+
どうやっても取得できないXPathがあったので、取得の方法を知りたく質問しました。
|
3
4
|
|
4
|
-
スプレットシートのimportXML関数(XPath)を利用し、データを抽出する
|
5
|
+
目的:スプレットシートのimportXML関数(XPath)を利用し、データを抽出する
|
5
6
|
|
6
|
-
■■な機能を実装中に以下のエラーメッセージが発生しました。
|
7
|
-
|
8
7
|
サイト
|
9
8
|
https://www.julian-fashion.com/en-US/product/120833/etro/beachwear/coulisse_swimshorts
|
10
9
|
|
@@ -21,21 +20,29 @@
|
|
21
20
|
|
22
21
|
# 該当のソースコード
|
23
22
|
|
24
|
-
|
23
|
+
右クリックから取得したXPathは以下となります。
|
25
24
|
/html/body/div[3]/div[8]/div/div[2]/div/div[2]/span[2]/span[2]
|
25
|
+
|
26
|
+
```ソースコード
|
27
|
+
=importXML("https://www.julian-fashion.com/en-US/product/120833/etro/beachwear/coulisse_swimshorts"
|
28
|
+
,"/html/body/div[3]/div[8]/div/div[2]/div/div[2]/span[2]/span[2]")
|
26
29
|
```
|
27
30
|
|
28
31
|
# 試したこと
|
32
|
+
pathを右から削って検証した所、
|
33
|
+
/html/body/div[3]/div[8]まで表示出来ました。
|
34
|
+
過去のログを見た所、このようなコメントがあったので、
|
35
|
+
|
29
36
|
>chromeのcopy xpathには対応していない
|
30
|
-
/を//に変えれば大体いけますけどね。
|
37
|
+
>/を//に変えれば大体いけますけどね。
|
31
|
-
|
38
|
+
|
32
|
-
/html/body/div[3]/div[8]まで表示出来ました。
|
33
39
|
ので、スラッシュを増やして入力した所、
|
34
40
|
/html/body/div[3]/div[8]//div
|
35
|
-
で
|
41
|
+
まで取得出来ました。
|
42
|
+
|
36
43
|
ただ、ページのソースコード内に書いてない内容が返されて意味が分かりません。
|
37
44
|
更に、次に進もうと、
|
38
|
-
/html/body/div[3]/div[8]//div//div/div
|
45
|
+
/html/body/div[3]/div[8]//div//div/div (または//div)
|
39
46
|
の時点でError:コンテンツが空と出ます。
|
40
47
|
どういうことなのでしょうか?
|
41
48
|
|