回答編集履歴

3

 

2022/07/31 10:10

投稿

退会済みユーザー
test CHANGED
@@ -1,25 +1,4 @@
1
- >今日出来事の1件目の値(7月31日)は取得できている
1
+ 下記ようなURLになります。
2
2
 
3
- >全て731日付の日付で取得するにはどのようにURLを加工したら良いでしょうか?
3
+ https://ja.wikipedia.org/w/api.php?action=query&prop=revisions&titles=7%E6%9C%8831%E6%97%A5&format=json&rvprop=content
4
4
 
5
- 何か誤解をされているようですが、action=query&list=search の形式で取得できるのはページの要約です。
6
- そして、action=query&list=searchの形式で取得できる「7月31日の情報」は、**すべて取得できています。**
7
-
8
- 「7月31日」という検索ワードに対して、検索結果に**7月31日以外のページ**(3月31日など)が追加で含まれている、というだけにすぎません。
9
-
10
- 多分質問者さんが欲しいのは、「7月31日」というページ内の「できごと」以降に書いてある部分を含めた**記事全部**なのでしょう。
11
-
12
- ならば内容全部を引っ張ってくるAPIをたたけばいいだけです。
13
-
14
- ```python
15
- import requests
16
- resp = requests.get("https://ja.wikipedia.org/w/api.php?action=query&list=search&srwhat=text&srsearch=7%E6%9C%8831%E6%97%A5&format=json")
17
- result = resp.json()
18
- # ほしい日付のページが結果の1番目にあるという前提
19
- pageid = result['query']['search'][0]['pageid']
20
- contents = requests.get(f"https://ja.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&pageids={pageid}&format=json")
21
- print(contents.json())
22
- ```
23
-
24
-
25
-

2

 

2022/07/31 10:04

投稿

退会済みユーザー
test CHANGED
@@ -7,9 +7,9 @@
7
7
 
8
8
  「7月31日」という検索ワードに対して、検索結果に**7月31日以外のページ**(3月31日など)が追加で含まれている、というだけにすぎません。
9
9
 
10
- 多分質問者さんが欲しいのは、「7月31日」というページ内の「できごと」以降に書いてある部分を含めた**詳細記事**なのでしょう。
10
+ 多分質問者さんが欲しいのは、「7月31日」というページ内の「できごと」以降に書いてある部分を含めた**記事全部**なのでしょう。
11
11
 
12
- ならば詳細記事を引っ張ってくるAPIをたたけばいいだけです。
12
+ ならば内容全部を引っ張ってくるAPIをたたけばいいだけです。
13
13
 
14
14
  ```python
15
15
  import requests

1

 

2022/07/31 10:03

投稿

退会済みユーザー
test CHANGED
@@ -7,7 +7,7 @@
7
7
 
8
8
  「7月31日」という検索ワードに対して、検索結果に**7月31日以外のページ**(3月31日など)が追加で含まれている、というだけにすぎません。
9
9
 
10
- 多分質問者さんが欲しいのは、「7月31日」というページ内の「できごと」以降に書いてある部分、つまり**詳細記事**なのでしょう。
10
+ 多分質問者さんが欲しいのは、「7月31日」というページ内の「できごと」以降に書いてある部分を含めた**詳細記事**なのでしょう。
11
11
 
12
12
  ならば詳細記事を引っ張ってくるAPIをたたけばいいだけです。
13
13