回答編集履歴

1

Pywikibotについて追記

2016/12/10 11:53

投稿

ikedas
ikedas

スコア4347

test CHANGED
@@ -12,5 +12,7 @@
12
12
 
13
13
  - 数百件程度なら、検索を自動化するまでもなく、手作業で目的の記事を探してリストアップし、それを取得すればいいのではないでしょうか。[MediaWiki API](https://www.mediawiki.org/wiki/API:Main_page/ja)には、記事名やカテゴリページ名を指定してページの内容を取得するインタフェースもあります。
14
14
 
15
+ - (追記) [Pywikibot](https://m.mediawiki.org/wiki/Manual:Pywikibot/ja)という、MediaWikiからの情報取得や記事編集を (半)自動化するためのフレームワークがあります。例えば、検索クエリを送信して結果の一覧をコンソールに表示し、一覧から選択した記事をダウンロードする、といった一連の作業を行うアプリケーションを作ることができます。
16
+
15
17
  - どうしても検索できるようにしたいのなら、ウィキペディアの記事データを収集してご自分でインデクス化することも考えられます。しかし、ウェブ経由でウィキペディア記事を大量に収集するようなクローラ行為は非推奨です。かわりに、公開されているデータベースダンプを使うべきです。[Wikipedia:データベースダウンロード](https://ja.wikipedia.org/wiki/Wikipedia:%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89)を参照。
16
18