回答編集履歴
1
Pywikibotについて追記
test
CHANGED
@@ -12,5 +12,7 @@
|
|
12
12
|
|
13
13
|
- 数百件程度なら、検索を自動化するまでもなく、手作業で目的の記事を探してリストアップし、それを取得すればいいのではないでしょうか。[MediaWiki API](https://www.mediawiki.org/wiki/API:Main_page/ja)には、記事名やカテゴリページ名を指定してページの内容を取得するインタフェースもあります。
|
14
14
|
|
15
|
+
- (追記) [Pywikibot](https://m.mediawiki.org/wiki/Manual:Pywikibot/ja)という、MediaWikiからの情報取得や記事編集を (半)自動化するためのフレームワークがあります。例えば、検索クエリを送信して結果の一覧をコンソールに表示し、一覧から選択した記事をダウンロードする、といった一連の作業を行うアプリケーションを作ることができます。
|
16
|
+
|
15
17
|
- どうしても検索できるようにしたいのなら、ウィキペディアの記事データを収集してご自分でインデクス化することも考えられます。しかし、ウェブ経由でウィキペディア記事を大量に収集するようなクローラ行為は非推奨です。かわりに、公開されているデータベースダンプを使うべきです。[Wikipedia:データベースダウンロード](https://ja.wikipedia.org/wiki/Wikipedia:%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89)を参照。
|
16
18
|
|