回答編集履歴
3
test
CHANGED
@@ -1,25 +1,4 @@
|
|
1
|
-
|
1
|
+
下記のようなURLになります。
|
2
2
|
|
3
|
-
|
3
|
+
https://ja.wikipedia.org/w/api.php?action=query&prop=revisions&titles=7%E6%9C%8831%E6%97%A5&format=json&rvprop=content
|
4
4
|
|
5
|
-
何か誤解をされているようですが、action=query&list=search の形式で取得できるのはページの要約です。
|
6
|
-
そして、action=query&list=searchの形式で取得できる「7月31日の情報」は、**すべて取得できています。**
|
7
|
-
|
8
|
-
「7月31日」という検索ワードに対して、検索結果に**7月31日以外のページ**(3月31日など)が追加で含まれている、というだけにすぎません。
|
9
|
-
|
10
|
-
多分質問者さんが欲しいのは、「7月31日」というページ内の「できごと」以降に書いてある部分を含めた**記事全部**なのでしょう。
|
11
|
-
|
12
|
-
ならば内容全部を引っ張ってくるAPIをたたけばいいだけです。
|
13
|
-
|
14
|
-
```python
|
15
|
-
import requests
|
16
|
-
resp = requests.get("https://ja.wikipedia.org/w/api.php?action=query&list=search&srwhat=text&srsearch=7%E6%9C%8831%E6%97%A5&format=json")
|
17
|
-
result = resp.json()
|
18
|
-
# ほしい日付のページが結果の1番目にあるという前提
|
19
|
-
pageid = result['query']['search'][0]['pageid']
|
20
|
-
contents = requests.get(f"https://ja.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&pageids={pageid}&format=json")
|
21
|
-
print(contents.json())
|
22
|
-
```
|
23
|
-
|
24
|
-
|
25
|
-
|
2
test
CHANGED
@@ -7,9 +7,9 @@
|
|
7
7
|
|
8
8
|
「7月31日」という検索ワードに対して、検索結果に**7月31日以外のページ**(3月31日など)が追加で含まれている、というだけにすぎません。
|
9
9
|
|
10
|
-
多分質問者さんが欲しいのは、「7月31日」というページ内の「できごと」以降に書いてある部分を含めた**
|
10
|
+
多分質問者さんが欲しいのは、「7月31日」というページ内の「できごと」以降に書いてある部分を含めた**記事全部**なのでしょう。
|
11
11
|
|
12
|
-
ならば
|
12
|
+
ならば内容全部を引っ張ってくるAPIをたたけばいいだけです。
|
13
13
|
|
14
14
|
```python
|
15
15
|
import requests
|
1
test
CHANGED
@@ -7,7 +7,7 @@
|
|
7
7
|
|
8
8
|
「7月31日」という検索ワードに対して、検索結果に**7月31日以外のページ**(3月31日など)が追加で含まれている、というだけにすぎません。
|
9
9
|
|
10
|
-
多分質問者さんが欲しいのは、「7月31日」というページ内の「できごと」以降に書いてある部分
|
10
|
+
多分質問者さんが欲しいのは、「7月31日」というページ内の「できごと」以降に書いてある部分を含めた**詳細記事**なのでしょう。
|
11
11
|
|
12
12
|
ならば詳細記事を引っ張ってくるAPIをたたけばいいだけです。
|
13
13
|
|