質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1245閲覧

python 正規表現 テキストファイル中の任意の文字列を含む行を抽出してエクセルファイルに書き込む

d415uke

総合スコア4

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/10/23 08:14

###実現したいこと
下記のようなテキストファイルから任意の文字列([任意の数字]: %XXXXX-[任意の数字]-XXXXX)を含んだ行だけを抽出して、新規エクセルファイルを作成および書き込んで保存したいと思っています。

sample.txt 1.May 22 16:22:19.978 JST: rmf_svr[317]: %SYS-5-CONFIG_I: Configured from console by console 2.-Traceback= 1A82 1AB4 6378 A072 1054 1860 3.Sep 8 21:50:25.322 JST: hsrp[12]: %BGP-5-ADJCHANGE: neighbor 12.12.44.198 Down BGP Notification sent 4.Sep 8 21:50:25.322 JST: dk_e[31]: %BGP-3-NOTIFICATION: sent to neighbor 10.12.44.198 4/0 (hold time expired) 0 bytes 5.18:47:02: %SYS-5-CONFIG_I: Configured from console by vty2 (10.34.195.36) 6.Sep 8 21:51:09.501 JST: vlan[543]: %BGP-5-ADJCHANGE: neighbor 12.12.44.198 Up 7.Oct 2 04:54:28.097 JST: snmp[4]: %LINEPROTO-5-UPDOWN: Line protocol on Interface FastEthernet1/0,changed state to down 8.Starting kernel log daemon...0 9.Oct 2 05:24:21.771 JST: rmf_svr[317]: %LINEPROTO-5-UPDOWN: Line protocol on Interface FastEthernet1/0,changed state to up

イメージとしましては、上記sample.txtから1,3,4,6,7,9行目を抽出しようと思っております。
実際のテキストファイルは1万行ほどあります。

###現状

f = open("sample.txt", "r") for line in f: if re.match(r"正規表現", line): print(line.strip()) f.close()

###環境
python 3.8.5
windows10 64bit
テキストエディタ:Visual Studio Code

###最後に
ご存じの方がいらっしゃれば、ご教授いただけますと幸いです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

に該当する正規表現が書けないということですか?
[\d+]: %\w+-\d+-[a-zA-Z0-9_]+
みたいな感じで良いと思います。正規表現について検索すれば色々書き方を教えるサイトがあると思います。
ファイルはカンマ区切りでcsvファイルにして保存したら良いと思います。

投稿2020/10/23 10:01

aoies

総合スコア331

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

d415uke

2020/10/26 06:08

ありがとうございます。 正規表現で「%」の表現方法が分からなかったので参考になりました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問