正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。
Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。
Q&A
解決済
3回答
2636閲覧
総合スコア12
2グッド
1クリップ
投稿2018/05/07 06:25
2
1
Kaggleの問題を解いていて、このコードに遭遇したんですが、 ' ([A-Za-z]+).'は何を意味しているのでしょうか?
ご回答よろしくお願いします。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
質問へのコメント
回答3件
0
ベストアンサー
pandas.Series.str.extractにおける第一引数' ([A-Za-z]+).'は正規表現で、各列値(Series)を、正規表現の()で囲まれたグループ部分毎に分割します。 参考:pandasの文字列を区切り文字や正規表現で複数の列に分割
' ([A-Za-z]+).'
()
Python1import pandas as pd 2df = pd.DataFrame({'c1':[' Hoge.com',' fuga.co.jp', 'ng.ne.jp', ' ng12.jp']}) 3print(df) 4df['c2'] = df['c1'].str.extract(' ([A-Za-z]+).', expand=False) 5print(df)
Python
1import pandas as pd 2df = pd.DataFrame({'c1':[' Hoge.com',' fuga.co.jp', 'ng.ne.jp', ' ng12.jp']}) 3print(df) 4df['c2'] = df['c1'].str.extract(' ([A-Za-z]+).', expand=False) 5print(df)
投稿2018/05/07 06:47
総合スコア38352
一文字以上のアルファベットの後にピリオドが続くパターン にマッチする部分文字列を取出そうとしています。
投稿2018/05/07 06:36
総合スコア13727
正規表現で調べてみてください。
投稿2018/05/07 06:39
総合スコア7196
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
15分調べてもわからないことはteratailで質問しよう!
ただいまの回答率85.31%
質問をまとめることで思考を整理して素早く解決
テンプレート機能で簡単に質問をまとめる
str.extract(' ([A-Za-z]+).', expand=False)の構造と意味を教えてください。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。