こんにちは。
python,pandasのDataFrameに入っている文字を分割して新規のカラムに追加したいのです。
'部署'を'部'、'課'、'グループ'に分割はできているのですが、
なぜか[]が入ってしまいます。
[A部] [B課] [Cグループ]
この[]が付かないようにするのはどうしたらよいのでしょうか?
そもそも、この現象はDataFrameの要素がリストになってしまっているのでしょうか?
python
1import pandas as pd 2 3df = pd.DataFrame({'部署':['A部B課Cグループ','D部E課Fグループ'], 4 '氏名':['ABC','DEF'] 5 }) 6print(df) 7 8df['部'] = df['部署'].str.findall('.*部') 9df['課'] = df['部署'].str.findall('(?<=部).*課') 10df['グループ'] = df['部署'].str.findall('(?<=課).*') 11 12print(df)
出力結果
python
1 氏名 部署 20 ABC A部B課Cグループ 31 DEF D部E課Fグループ 4 5 氏名 部署 部 課 グループ 60 ABC A部B課Cグループ [A部] [B課] [Cグループ] 71 DEF D部E課Fグループ [D部] [E課] [Fグループ]
期待している結果
氏名 部署 部 課 グループ 0 ABC A部B課Cグループ A部 B課 Cグループ 1 DEF D部E課Fグループ D部 E課 Fグループ
環境
Python 3.5.2 :: Anaconda custom (64-bit)
pandas 0.19.2
以上、よろしくお願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/01/25 13:41
2017/01/25 15:36
2017/01/26 11:51