前提・実現したいこと
Kaggle(タイタニックの生存率)に取り組んでいた際、pandas.Series.str.extract()
の表現を見つけました[1]。
Python3
1for train in combine1: 2 train['Salutation'] = train.Name.str.extract(' ([A-Za-z]+).', expand=False)
使われている関数を知らなかった(理解できなかったので)調べてみた所、過去にもTeratailでも同様の質問がされていたのですが[2]、そこで紹介されていたサイトでもいまいち意味が理解できませんでした[3][4]。
主に理解できなかったのは、以下の点です。
・[2],[3],[4]のサイトで”正規表現"という語句を使っているが、肝心の意味が理解できない。
(一体何が正規表現で、何が正規表現を正規表現たらしめているのか?)
教えて頂きたい事
一通りは自分で調べてみたのですが、自分の疑問を解決できるサイトが(自力)で見つけられませんでした。
(teratailに限らず)過去の回答でも、解説されているサイトを教えて頂きたいです。
参考サイト等
[1] https://lp-tech.net/articles/0QUUd/view?page=2
[2] https://teratail.com/questions/125057
[3] https://note.nkmk.me/python-pandas-split-extract/
[4] https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.extract.html
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/08/07 10:07