質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
データ構造

データ構造とは、データの集まりをコンピュータの中で効果的に扱うために、一定の形式に系統立てて格納する形式を指します。(配列/連想配列/木構造など)

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

4回答

560閲覧

正規表現の方法について

marugoshi

総合スコア2

データ構造

データ構造とは、データの集まりをコンピュータの中で効果的に扱うために、一定の形式に系統立てて格納する形式を指します。(配列/連想配列/木構造など)

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

2クリップ

投稿2021/04/13 15:18

##わからないこと
以下のように、改行されていてかつ末尾に句読点のない文章に句読点を打ちたいのですが、正規表現の方法がわからないためご教授いただけないでしょうか。

##データのイメージ
####元データ

おはようございます

こんにちは

こんばんは。

####欲しいデータ

おはようございます。
こんにちは。
こんばんは。

##試したこと

python

1text='\nおはようございます\n\nこんにちは\n\nこんばんは。\n' 2re.sub('\n+', '。', text) 3>>'。おはようございます。こんにちは。こんばんは。。'

python

1re.sub('^.*?\n+', '。', text) 2>>'。おはようございます\n\nこんにちは\n\nこんばんは。\n'

等・・・ほかにも末尾に$をつけたり色々試行錯誤しているのですが、なかなか欲しい答えが出ないです。
初歩的な質問で大変恐縮ですが、宜しくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答4

0

ベストアンサー

課題は、

改行の直前に「。」以外の文字が来ている場合は「。」を書き足すという置換を、正規表現一発で実現させられるか?

ということでよろしいんですね。
これでどうでしょう。

Python 3.4.10 (default, Oct 4 2019, 19:39:58) Type 'copyright', 'credits' or 'license' for more information IPython 6.2.1 -- An enhanced Interactive Python. Type '?' for help. In [1]: import re In [2]: text='\nおはようございます\n\nこんにちは\n\nこんばんは。\n' In [3]: print(re.sub(r'([^\n。])\n', '\1。\n', text)) おはようございます。 こんにちは。 こんばんは。

投稿2021/04/13 21:22

KojiDoi

総合スコア13671

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

marugoshi

2021/04/14 01:49

実現したい内容を正確に把握していただき、なおかつシンプルなコード1行で実現してくださったKojiDoiさんをベストアンサーに選ばせていただきました!ありがとうございました✨
guest

0

正規表現を一つでやる方法は思いつきませんでした。
正規表現二つなら以下です。

python

1>>> text='\nおはようございます\n\nこんにちは\n\nこんばんは。\n' 2>>> print(re.sub('(?<!。)\n+', '。\n', re.sub('^\n+', '', text))) 3おはようございます。 4こんにちは。 5こんばんは。

(?<!...)は、否定後読みアサーションと呼ばれるパターンです。
詳しいことを知りたければre --- 正規表現操作のページ内検索で否定後読みアサーションを探してください。

投稿2021/04/13 15:53

編集2021/04/13 16:46
ppaul

総合スコア24666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

正規表現をあえて使うのであれば、こんな感じでいかがでしょうか?

import re text = '\nおはようございます\n\nこんにちは\n\nこんばんは。\n' print(re.sub("\n", "。\n", text))

投稿2021/04/13 15:36

nabenabe11234

総合スコア126

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

難しい正規表現を使わないとすると、
1."\n""。\n"に置換。
2."。。\n""。\n"に置換(もともとが付いていた部分)。
の2ステップで出来ます。正規表現を使うまでも無い。

投稿2021/04/13 15:24

otn

総合スコア84505

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問