python 旧字体　抽出方法

CSVファイルを読み込んで作成したDataFrameの全体のセルに対して「旧字体が含まれる場合はその行を抽出する」もしくは、「旧字体を常用漢字に変換する」コードを作成したいです。
どのような流れでこれが実現できるか分かりません。同じような情報を見つけることができませんでした。

遠回りな実現方法として、「旧字体一覧表を別に作成して読み込み、その表に含まれる字がある行を抽出する」かと思うのですが、他にもっとよいアイデアはありますでしょうか？
よろしくお願いいたします。

行動規範の内容に同意します

回答2件

ベストアンサー

以下のようにします。

python
1>>> import pandas as pd
2>>> print(df)
3     姓    名 クラス  得点
40  國立  權三      A    30
51  螢野    光      A    50
62  奧田  櫻子      C    60
73  廣瀬  悅朗      C    40
8>>> tr_table = str.maketrans('國權螢奧櫻廣悅朗', '国権蛍奥桜広悦朗')
9>>> df2 = df.copy()
10>>> df2['姓'] = df2['姓'].apply(lambda x: x.translate(tr_table))
11>>> df2['名'] = df2['名'].apply(lambda x: x.translate(tr_table))
12>>> print(df2)
13     姓    名 クラス  得点
140  国立  権三      A    30
151  蛍野    光      A    50
162  奥田  桜子      C    60
173  広瀬  悦朗      C    40