質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

2回答

1094閲覧

スクレイピングについて

uyama0106

総合スコア10

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2018/11/14 02:07

前提・実現したいこと

Python3のBeautifulSoupでスクレイピングに初挑戦しています。
以下の塊までは抜き出せたのですが、この中から下部にあるメールアドレスだけを抜き出したいです。
必ずしも「メールアドレス:」のあとにメールアドレスがくるわけではないので
@を含む文字列を正規表現とかで抽出する必要があるのかなと考えているのですがアドバイス頂けますと幸いです。

[<div class="rich-text">
会社名:株式会社●●<br/>

所在地:東京都<br/>

■ お問い合わせ<br/>

メールアドレス:hoge@hoge.com
</div>]

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

(?<=メールアドレス:)(.+?)(?=</div>) ですか?

ちなみに、いつもスクレイピングツールoctoparseを使っています。
その中に正規表現を自動生成する機能もあり、便利です。

投稿2018/11/23 08:19

編集2019/03/12 01:56
Yuki-Sakuraba

総合スコア163

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

質問内容と添付のHTML構造を見る限り正規表現を使うしか選択肢はないですな

投稿2018/11/14 02:30

yamato_user

総合スコア2321

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問