🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Webサイト

一つのドメイン上に存在するWebページの集合体をWebサイトと呼びます。

コピー

元のオブジェクトを破壊することなく、オブジェクトの複製を生成することをコピーと呼びます。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

2回答

1420閲覧

webサイトにおいて特定の文字列のリストをコピーしたい

nandemoggl

総合スコア20

Webサイト

一つのドメイン上に存在するWebページの集合体をWebサイトと呼びます。

コピー

元のオブジェクトを破壊することなく、オブジェクトの複製を生成することをコピーと呼びます。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

0クリップ

投稿2019/10/12 07:17

編集2019/10/12 07:19

前提・実現したいこと

webサイトにおいて特定の文字列のリストをコピーor転記したい
できるだけ簡単に

もう少し詳しく説明しますと、Html上で<li>化されてるあるテキスト部分だけコピーしたいんですけど<ul>タグのなかがdivなどが色々入ってたり、選択不可の部分があったりでそのままブラウザ上で選択しようとするのはうまくいきません。
仮にできても大量なので手動ではあまりやりたくありません。

試したこと

現状やってるのはデベロッパーツールを使ってulタグ全体を選択して全部コピーしてExcelに貼り付け取り出したいところを抽出してます。

補足情報(FW/ツールのバージョンなど)

その文字列はclassやIDはついてませんがspanタグで囲まれています。
リストは一度に表示できる上限があります。100件
それ以上は別のページに移動しないといけません。リストは最大1000件未満程度
順番も表示通りに漏れ、重複なく全て確実に抽出したいです。
現状よりもうちょっとスマートな方法、ツール開発できるようになれれば有り難いです。

勉強する言語、方向性だけでも教えていただけたら幸いです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ScrapeStormと言うWebスクレイピングツールを試してみてください。
初心者向けの視覚的に分かりやすくデータを抽出できるWebスクレイピングツールです。コードを書くことなく、Webサイトから大量の情報を手軽に抽出できます。しかも無料版もあります。
https://www.scrapestorm.com/jp/

投稿2019/10/12 09:32

編集2019/10/12 09:35
ScrapeStorm.jp

総合スコア99

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

Beautiful Soup という python のライブラリを使うと、簡単にスクレイピングができます。
コードの書き方とかは、Beautiful Soup, スクレイピングとかで検索すれば、いっぱい出てくるかと。

投稿2019/10/12 08:56

Akashic

総合スコア298

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問