前提・実現したいこと
Python初心者なのですがよろしくお願いします。
作業効率のために
googleスプレットシート上にある多数の企業リストから自動的にそのらのホームページに飛ぶようにして
電話番号や住所、メールアドレスなどを一斉抽出できるようなものを作れないかと考えています。
仮のイメージとしましては、スプレットシート上にリストが
会社名 電話番号 メールアドレス 住所
A社
B社
C社
.
.
と並んでいて、プログラミングにより
A社 080.. @.com 東京都...
B社 080.. @.com 東京都....
C社 080.. @.com 東京都...
のように抽出できる方法はないか調べています。
試したこと
(できていること)
webページのスクレイピングの方法はPythonのbeautifulsoupなどを用いてできました。
googleスプレットシートの中身の抽出もPythonを用いてできました。(必要ないかも知れましんが)
補足情報(FW/ツールのバージョンなど)
私の考えですと、webページが同じ形式なら情報を抜き取ることが可能かと思いましたが、それぞれ異なるホームページからの自動抽出はできるのかわかりません。
予想ですが、検索エンジンか何かに「電話番号」や「企業情報」といった文字列を含めさせることでどうにかなるのかなと思ったのですが、無知なものでいくら調べてもそのようなものは見つかりませんでした。
また、企業のホームページですとさまざまな飛べるリンクがあり、そのページ遷移の方法もどのようにすればいいかわからない状況です。
*説明がわかりにくければコメントお願いします。
ps 私はJava初心者でつい先日からPythonを独学で学び始めました。お力をいただけると幸いです!
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。