検索エンジンなど大量のHPを収集してそこから様々な有用な情報を引き出したり、タグ付けして管理していると思います。
個人でその元情報となるHPを大量に収集したいと思っているのですがどのような方法がありますか?
大量にデータを集めるフリーソフトなどはありますか?
それとも、検索エンジンのようにリンクを置いながら片っ端から集めるようなソフトを自作する必要がありますか?
もしくは、どこかにHPを集めたデータサイトなどありますでしょうか?
なお、現在の所規模が大きくなりすぎるとHDDに入りませんので日本語サイトで文字のみに限定し、日記など個人が頻繁に更新しているサイトやニュースサイトのみを対象に考えています。
ホームページを大量に集める良い方法を教えていただければ幸いです。
宜しくお願い致します。
回答3件
あなたの回答
tips
プレビュー