質問編集履歴

6

文章の修正

2020/09/02 11:04

投稿

yarukkyanai
yarukkyanai

スコア10

test CHANGED
File without changes
test CHANGED
@@ -20,11 +20,13 @@
20
20
 
21
21
  ```
22
22
 
23
- で、HTMLがハイライトされ、XPATHをはじめとした要素が取得できました。
23
+ で、HTMLがハイライトされ、XPATHをはじめとした要素が取得でき
24
+
25
+ 取得した要素によってスクレイピングできました。
24
26
 
25
27
 
26
28
 
27
- しかし、下記を試したところ、
29
+ しかし、下記の関数プログラミングのスクレイピングを試したところ、
28
30
 
29
31
  [https://stackoverflow.com/questions/61263097/google-sheets-yahoo-finance-importxml-text-not-td-data](https://stackoverflow.com/questions/61263097/google-sheets-yahoo-finance-importxml-text-not-td-data)
30
32
 

5

文字の修正

2020/09/02 11:04

投稿

yarukkyanai
yarukkyanai

スコア10

test CHANGED
File without changes
test CHANGED
@@ -42,7 +42,7 @@
42
42
 
43
43
  自分の理解では、
44
44
 
45
- 次の画像のハイライトされた部分を入れるべきと思い、関数に入れたところ以下のエラーになってしまいます。
45
+ 次の画像のハイライトされた部分の要素を入れるべきと思い、関数に入れたところ以下のエラーになってしまいます。
46
46
 
47
47
  ![イメージ説明](3235ca8bb5fe8159c2f07bf774d0c56a.jpeg)
48
48
 

4

リンクを挿入

2020/09/02 11:02

投稿

yarukkyanai
yarukkyanai

スコア10

test CHANGED
File without changes
test CHANGED
@@ -26,7 +26,7 @@
26
26
 
27
27
  しかし、下記を試したところ、
28
28
 
29
- https://stackoverflow.com/questions/61263097/google-sheets-yahoo-finance-importxml-text-not-td-data
29
+ [https://stackoverflow.com/questions/61263097/google-sheets-yahoo-finance-importxml-text-not-td-data](https://stackoverflow.com/questions/61263097/google-sheets-yahoo-finance-importxml-text-not-td-data)
30
30
 
31
31
  なぜ、
32
32
 

3

文章の修正

2020/09/02 11:01

投稿

yarukkyanai
yarukkyanai

スコア10

test CHANGED
File without changes
test CHANGED
@@ -12,11 +12,11 @@
12
12
 
13
13
 
14
14
 
15
- 右クリック>「検証」
15
+ スクレイピングで情報取得したい箇所を含むサイトを右クリック>「検証」
16
16
 
17
17
  >表示される左上の□に↑のアイコン(Select an element in the page to inspect it)を左クリック
18
18
 
19
- >任意の取得したいデータが表示されている箇所を左クリック
19
+ >任意のスクレイピングで取得したいデータが表示されている箇所を左クリック
20
20
 
21
21
  ```
22
22
 

2

画像追加

2020/09/02 11:00

投稿

yarukkyanai
yarukkyanai

スコア10

test CHANGED
File without changes
test CHANGED
@@ -44,7 +44,7 @@
44
44
 
45
45
  次の画像のハイライトされた部分を入れるべきと思い、関数に入れたところ以下のエラーになってしまいます。
46
46
 
47
-
47
+ ![イメージ説明](3235ca8bb5fe8159c2f07bf774d0c56a.jpeg)
48
48
 
49
49
  どのXpathを拾ってくるべきなのか、アドバイスいただければ幸いです。
50
50
 

1

以前の下書きの途中のものだったものがなぜか反映されてしまった。

2020/09/02 10:59

投稿

yarukkyanai
yarukkyanai

スコア10

test CHANGED
File without changes
test CHANGED
@@ -24,15 +24,31 @@
24
24
 
25
25
 
26
26
 
27
- しかし、色々なサイトです中
27
+ しかし、下記をしたところ
28
28
 
29
- https://finance.yahoo.com/quote/TSLA/key-statistics?p=TSLA
29
+ https://stackoverflow.com/questions/61263097/google-sheets-yahoo-finance-importxml-text-not-td-data
30
30
 
31
+ なぜ、
32
+
33
+ ```
34
+
31
- のサイトで同じように行おうとすると次のキャプチャ画像のように、HTMLが今までと違ってハイライトされず、どの要素を拾ってよいかわかりません。
35
+ //h2[@data-reactid='139']/../p
36
+
37
+ ```
38
+
39
+ を関数の後半部分に入れるXpathに指定するのかわかりません。
32
40
 
33
41
 
34
42
 
43
+ 自分の理解では、
35
44
 
45
+ 次の画像のハイライトされた部分を入れるべきと思い、関数に入れたところ以下のエラーになってしまいます。
46
+
47
+
48
+
49
+ どのXpathを拾ってくるべきなのか、アドバイスいただければ幸いです。
50
+
51
+ よろしくお願いいたします。
36
52
 
37
53
 
38
54
 
@@ -40,21 +56,23 @@
40
56
 
41
57
 
42
58
 
43
- ```
59
+ ハイライトされている部分のXPathをコピーして代入した場合
44
60
 
45
61
 
46
62
 
47
63
  ```
48
64
 
65
+ =IMPORTXML("http://finance.yahoo.com/quote/AAPL/profile","//*[@id='Col1-0-Profile-Proxy']/section/section[2]/h2")
49
66
 
67
+ ```
50
68
 
51
- ### 該当のソスコード
69
+ 出力されたエラ
52
70
 
53
71
 
54
72
 
55
- ```ここに言語名を入力
73
+ ```
56
74
 
57
- ード
75
+ #N/A(インポトしたンテンツは空です)
58
76
 
59
77
  ```
60
78
 
@@ -64,7 +82,25 @@
64
82
 
65
83
 
66
84
 
67
- ここに問題に対ししたことを記載してください。
85
+ ハイライトされいる箇所のClassの情報を入れてみましたら、
86
+
87
+ ```
88
+
89
+ =IMPORTXML("http://finance.yahoo.com/quote/AAPL/profile","//*[@class="Fz(m) Lh(1) Fw(b) Mt(0) Mb(18px)"])
90
+
91
+ ```
92
+
93
+ エラーでなく、
94
+
95
+ ```
96
+
97
+ Description
98
+
99
+ Corporate Governance
100
+
101
+ ```
102
+
103
+ と出力されました。
68
104
 
69
105
 
70
106
 
@@ -72,4 +108,4 @@
72
108
 
73
109
 
74
110
 
75
- ここにより詳細な情報記載しください。
111
+ Googleスプレッドシート使っています