質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

3回答

2044閲覧

正規表現,pandas,全角半角括弧の中身を括弧ごと消したい。

ArMigELo

総合スコア76

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/06/15 21:47

編集2021/06/16 00:13

全角半角括弧の中身を、括弧ごとまるごと消したいです。
下記のコードを書きましたが消えてくれません。
中身の文字の長さが違います。
ヘッダー部を1本のコードで一気に消す方法はありませんか?

消したい文字列は
(侵襲性インフルエンザ菌感染症、侵襲性髄膜炎菌感染症、侵襲性肺炎球菌感染症を除く。)
(病原体がフレボウイルス属SFTSウイルスであるものに限る。)
(ウエストナイル脳炎、西部ウマ脳炎、ダニ媒介脳炎、東部ウマ脳炎、日本脳炎、ベネズエラウマ脳炎及びリフトバレー熱を除く。)
(鳥インフルエンザ及び新型インフルエンザ等感染症を除く。)
(病原体がフレボウイルス属SFTSウイルスであるものに限る。)
などになります。

これが
In515 細菌性髄膜炎(侵襲性インフルエンザ菌感染症、侵襲性髄膜炎菌感染症、侵襲性肺炎球菌感染症を除く。)

In515 細菌性髄膜炎
こうなるイメージです。

df_jp_sum.replace("/(.*?!)\|(.*?!)\" , "")

イメージ説明

何卒ご教授お願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

ベストアンサー

ヘッダー部(カラム名)を変更するには、DataFrame.rename(columns=...)を使います。

python

1df = df.rename(columns=lambda c: re.sub(r'(.*?)|(.*?)', '', c))

columnsに直接セットする方法もあります。

python

1df.columns = df.columns.str.replace(r'(.*?)|(.*?)', '', regex=True)

投稿2021/06/16 01:07

bsdfan

総合スコア4574

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ArMigELo

2021/06/16 01:55

完璧です。 ありがとうございました。 reを使わなくていいバージョンまでありがとうございます! 助かりました。
guest

0

こういう感じです。

python

1>>> import re 2>>> print(df) 3 症状 数 4In515 細菌性髄膜炎(侵襲性インフルエンザ菌感染症、侵襲性髄膜炎菌感染症、侵襲性肺炎球菌感染症を除く。) 54 5In440 レジオネラ症 31 6In534 重症性血小板減少性症候群(病原体がフレボウイルス属SFTSウイルスであるものに限る。) 10 7>>> df['症状'] = df['症状'].apply(lambda x: re.sub("(.+)|(.+)" , "", x)) 8>>> print(df) 9 症状 数 10In515 細菌性髄膜炎 54 11In440 レジオネラ症 31 12In534 重症性血小板減少性症候群 10

投稿2021/06/15 23:53

ppaul

総合スコア24666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ArMigELo

2021/06/16 01:52

今回私の環境ではエラーが出てしまったものの、すごく勉強になりました。 ありがとうございました。
guest

0

Pandas については全く知らないので外しているかもしれませんが、私の環境のPython では以下のコードでお望みの挙動をするように見えます。

python

1Python 3.6.6 (v3.6.6:4cf1f54eb7, Jun 27 2018, 03:37:03) [MSC v.1900 64 bit (AMD64)] on win32 2Type "help", "copyright", "credits" or "license" for more information. 3>>> import re 4>>> re.sub(r'([^)]*)',"","In515 細菌性髄膜炎(侵襲性インフルエンザ菌感染症、 侵襲性髄膜炎菌感染症、侵襲性肺炎球菌感染症を除く。)") 5'In515 細菌性髄膜炎' 6>>>

投稿2021/06/15 22:54

kozuchi

総合スコア1193

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ArMigELo

2021/06/16 01:52

今回はエラーが出てしまったものの、すごく勉強になりました。 ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問