質問するログイン新規登録

質問編集履歴

4

衍字の訂正

2020/07/03 01:48

投稿

zidaraku
zidaraku

スコア1

title CHANGED
File without changes
body CHANGED
@@ -45,7 +45,7 @@
45
45
 
46
46
  ただ、ページのソースコード内に書いてない内容が返されて意味が分かりません。
47
47
  更に、次に進もうと、
48
- /html/body/div[3]/div[8]//div//div/div (または//div)
48
+ /html/body/div[3]/div[8]//div//div (または//div)
49
49
  の時点でError:コンテンツが空と出ます。
50
50
  どういうことなのでしょうか?
51
51
 

3

見た目の改善

2020/07/03 01:48

投稿

zidaraku
zidaraku

スコア1

title CHANGED
File without changes
body CHANGED
@@ -7,19 +7,14 @@
7
7
  サイト
8
8
  https://www.julian-fashion.com/en-US/product/120833/etro/beachwear/coulisse_swimshorts
9
9
 
10
- # 発生している問題・エラーメッセージ
11
10
 
11
+ # 該当のソースコード
12
+
12
13
  抜きたい情報がサイト内のこの部分で
13
14
  ブランド名 E---
14
- 商品名 C--------(略)-------
15
+ 商品名 C--------(略)------- ←今回はココ
15
16
  値段:
16
17
 
17
- ```
18
- 結果:Error:インポートしたコンテンツが空です。
19
- ```
20
-
21
- # 該当のソースコード
22
-
23
18
  右クリックから取得したXPathは以下となります。
24
19
  /html/body/div[3]/div[8]/div/div[2]/div/div[2]/span[2]/span[2]
25
20
 
@@ -28,6 +23,14 @@
28
23
  ,"/html/body/div[3]/div[8]/div/div[2]/div/div[2]/span[2]/span[2]")
29
24
  ```
30
25
 
26
+ # 発生している問題・エラーメッセージ
27
+
28
+
29
+ ```
30
+ 結果:Error:インポートしたコンテンツが空です。
31
+ ```
32
+
33
+
31
34
  # 試したこと
32
35
  pathを右から削って検証した所、
33
36
  /html/body/div[3]/div[8]まで表示出来ました。
@@ -67,7 +70,9 @@
67
70
  を見つけて変換した所、
68
71
  ```
69
72
  /html/body/div[3]/div[8]/div/div[2]/div
73
+ ```
70
74
  が以下になりました。
75
+ ```
71
76
  /descendant::*[local-name() = "/html/body/div/div/div/div/div" or local-name() = "/HTML/BODY/DIV/DIV/DIV/DIV/DIV"][(@3) and (@8) and (@2)]"
72
77
  ```
73
78
  そのまま打ち込むと"(ダブルコーテーション)云々でバグったので一旦別のセルに入れて参照した所機能しました。

2

試した事の追記

2020/06/29 08:42

投稿

zidaraku
zidaraku

スコア1

title CHANGED
File without changes
body CHANGED
@@ -58,4 +58,21 @@
58
58
 
59
59
  有識者の方、よろしくお願いいたします。
60
60
 
61
- ※Seleniumが楽と多々見るので、これから触ってみたいと思います。
61
+ ※Seleniumが楽と多々見るので、これから触ってみたいと思います。
62
+
63
+
64
+ 【追記】
65
+ CSS セレクタをXPathに変換する(サイト下部)
66
+ https://piro.sakura.ne.jp/latest/blosxom/mozilla/xul/2007-09-13_selector-to-xpath.htm
67
+ を見つけて変換した所、
68
+ ```
69
+ /html/body/div[3]/div[8]/div/div[2]/div
70
+ が以下になりました。
71
+ /descendant::*[local-name() = "/html/body/div/div/div/div/div" or local-name() = "/HTML/BODY/DIV/DIV/DIV/DIV/DIV"][(@3) and (@8) and (@2)]"
72
+ ```
73
+ そのまま打ち込むと"(ダブルコーテーション)云々でバグったので一旦別のセルに入れて参照した所機能しました。
74
+
75
+ この状態で参照すると「URLが参照できません」と出ます。
76
+ 同じ内容をURLを打ち込むと出来るんですが、参照できないらしいですね。
77
+
78
+ なお、 最後に「/h2」があると内部インポートエラーになりました。

1

誤字脱字の修正

2020/06/29 08:30

投稿

zidaraku
zidaraku

スコア1

title CHANGED
File without changes
body CHANGED
@@ -1,10 +1,9 @@
1
1
  # 前提・実現したいこと
2
2
 
3
+ どうやっても取得できないXPathがあったので、取得の方法を知りたく質問しました。
3
4
 
4
- スプレットシートのimportXML関数(XPath)を利用し、データを抽出する
5
+ 目的:スプレットシートのimportXML関数(XPath)を利用し、データを抽出する
5
6
 
6
- ■■な機能を実装中に以下のエラーメッセージが発生しました。
7
-
8
7
  サイト
9
8
  https://www.julian-fashion.com/en-US/product/120833/etro/beachwear/coulisse_swimshorts
10
9
 
@@ -21,21 +20,29 @@
21
20
 
22
21
  # 該当のソースコード
23
22
 
24
- ```引っ張ったXPathは以下となります。
23
+ 右クリックから取得したXPathは以下となります。
25
24
  /html/body/div[3]/div[8]/div/div[2]/div/div[2]/span[2]/span[2]
25
+
26
+ ```ソースコード
27
+ =importXML("https://www.julian-fashion.com/en-US/product/120833/etro/beachwear/coulisse_swimshorts"
28
+ ,"/html/body/div[3]/div[8]/div/div[2]/div/div[2]/span[2]/span[2]")
26
29
  ```
27
30
 
28
31
  # 試したこと
32
+ pathを右から削って検証した所、
33
+ /html/body/div[3]/div[8]まで表示出来ました。
34
+ 過去のログを見た所、このようなコメントがあったので、
35
+
29
36
  >chromeのcopy xpathには対応していない
30
- /を//に変えれば大体いけますけどね。
37
+ /を//に変えれば大体いけますけどね。
31
- 過去のログを見た所、このようなコメントがあったので、pathを右から削って検証した所、
38
+
32
- /html/body/div[3]/div[8]まで表示出来ました。
33
39
  ので、スラッシュを増やして入力した所、
34
40
  /html/body/div[3]/div[8]//div
35
- 次の段階の取得まで出来ました。
41
+ で取得出来ました。
42
+
36
43
  ただ、ページのソースコード内に書いてない内容が返されて意味が分かりません。
37
44
  更に、次に進もうと、
38
- /html/body/div[3]/div[8]//div//div/div class (または//div)
45
+ /html/body/div[3]/div[8]//div//div/div (または//div)
39
46
  の時点でError:コンテンツが空と出ます。
40
47
  どういうことなのでしょうか?
41
48