質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

551閲覧

python 正規表現で文字列を分割したいのに……

open_hs

総合スコア1

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/05/13 05:53

前提・実現したいこと

python3で読み込んだ下記のテキストファイルに対して、
正規表現をかけて分割しようとしているのですがうまくいきません…。

<[Project] HTML section> contents_html=/test.html 1 all_time </[Project] HTML section> <[Project] Message section> title="TEST Selenium Alert" smtp_server=smtp.gmail.com body=main message from=test_from to=test_to </[Project] Messaging section>

試したこと

pythoon3

1 2import re 3 4#読み込んだテキスト 5text = '\n<[Project] HTML section>\n\tcontents_html=/test.html 1 all_time\n</[Project] HTML section>\n\n<[Project] Message section>\n\ttitle="TEST Selenium Alert"\n\tsmtp_server=smtp.gmail.com\n\tbody=main message\n\tfrom=test_from\n\tto=test_to\n</[Project] Messaging section>\n' 6 7result = re.findall(r'<.+>.+</.+>',text,re.DOTALL) 8

進めているうちに「貪欲マッチなんてあったなぁ」等と思い出しながら色々と試しましたが、
中々思うようにいきません。

↓求めている結果

result = [ '<[Project] HTML section>略</[Project] HTML section>', '<[Project] Message section>略</[Project] Message section>' ]

誰か助けてください(泣)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Hyugopython

2021/05/13 05:59

htmlファイルというと、どこからかスクレイピングして取得してきているのですか? seleniumとか、bs4であれば正規表現を使わずにお望みのことをできると思います、
guest

回答1

0

ベストアンサー

「貪欲マッチなんてあったなぁ」

はい、貪欲マッチを避けて非貪欲マッチを使えば解決するはずです。正規表現中の ++? に置き換えてください。(3つとも)

それでもデータが title="TEST </Selenium> Alert" なんてなっていると期待通りには動かないとは思いますが。

投稿2021/05/13 06:08

編集2021/05/13 06:39
int32_t

総合スコア21008

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問