pandasのDataframe上で正規表現を使用してデータを抜き出したが、エラーが出ました。

前提・実現したいこと

pandasデータフレーム上のsrcIP列に存在するIPアドレスのデータの内、
IPアドレスの第2オクテットまでのデータを抜き出したいです。

Ex. 1.1.1.1 のデータがあれば 1.1.　のみを取り出したいです。
難しければドット部分を省いて、1.1だけでも問題ありません。

参考程度に読み込んだ対象データの中身について記載しました。
No srcIP US_label_Tree
0 1.1.1.1 0
1 1.1.1.2 0
2 1.1.1.3 4

発生している問題・エラーメッセージ

Traceback (most recent call last):
  File "zikken-99.py", line 11, in <module>
    df_0=df_0[df_0['srcIP'].str.extract("(.*)(?=.)")]
  File "C:\Users\a\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\core\frame.py", line 2914, in __getitem__
    return self._getitem_frame(key)
  File "C:\Users\a\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\core\frame.py", line 3009, in _getitem_frame
    raise ValueError('Must pass DataFrame with boolean values only')
ValueError: Must pass DataFrame with boolean values only

該当のソースコード

python
1import pandas as pd
2
3year=2020
4month=6
5day=1
6hour=1
7
8df = pd.read_csv('D:\1120-6月\教師データ=0601\All-country-label-Meanshift-digits-29-label-{year1}-{month1}-{day1}-{hour1}.csv'.format(year1=year,month1=month,day1=day,hour1=hour))
9df_0=df[df['US_label_Tree'] == 0]#ラベル番号が0のみを取り出す
10
11df_0=df_0[df_0['srcIP'].str.extract('(([1-9]?[0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]).){1}([1-9]?[0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])')]#第2オクテットまでのデータを抜き出したい
12print(df_0)

試したこと

srcIPの列の型を調べてもobject型になっていて、
エラーの原因がわかりません。

str.extraxtのところをstr.containsに変更したら、エラーがでなくなりました・

python
1print(df_0[df_0['srcIP'].str.contains('(([1-9]?[0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]).){1}([1-9]?[0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])')])

該当のソースコードに書いてある正規表現は下記のサイトを参考にしました。
https://teratail.com/questions/101693

上記のサイトの正規表現のコードに関する引用文：

python
1m = re.match('(([1-9]?[0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]).){3}([1-9]?[0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])', address)

正規表現で変更した所は、上記のコードの{3}のところを{1}に変えました。

補足情報（FW/ツールのバージョンなど）

windows10
python

お手数おかけしますが、答えて頂ければ幸いです。

行動規範の内容に同意します

回答1件

ベストアンサー

以下のような文字列操作のみでよさそうです。

Python
1import pandas as pd
2from io import StringIO
3
4s = """No    srcIP    US_label_Tree
50    1.1.1.1    0
61    1.1.1.2    0
72    1.1.1.3    4"""
8df = pd.read_csv(StringIO(s), delimiter='\s+')
9
10df = df[df['US_label_Tree'] == 0]#ラベル番号が0のみを取り出す
11
12df['srcIP'] = df['srcIP'].apply( lambda ip: '.'.join(ip.split('.')[:2]))
13print(df)
14#   No srcIP  US_label_Tree
15#0   0   1.1              0
16#1   1   1.1              0