Python Pandas 近い値のある行を削除する

たくさんある行で、X列、Y列が近い値のものは削除するプログラムを作成しており、
最もシンプルで簡単な方法を探しております。

Name,X,Y,Score
1,4052,1318,29
1,4451,1209,34.4
1,641,2374,86
1,1460,2244,44.8
1,2561,2398,34.2
1,1522,2256,31.3
1,4529,2414,74.3
1,4998,1664,62
2,1028,1549,89.3
2,1375,1485,86.2
2,685,1315,26.9
2,1819,1555,26.8
2,2883,2130,24.2
2,1373,1474,33.8
2,1121,2103,25.2
2,2743,2135,25.4
2,4201,2003,56.2
2,1028,1539,90
4,2741,948,82.7
4,2727,951,88.5
4,3774,1988,83.6
4,4997,1972,75.3
4,1132,1737,21
4,3766,1985,60.4
4,2837,1652,55.8
4,3849,2220,45.2
4,2550,2129,26.1

Name列がメインで、そのName列が同じ中から、X、Yの近い行を削除したいと思っております。
近い値は、とりあえず、±50以内にあるものと定義しております。
コードは以下で、

import pandas as pd

df = pd.read_csv("〇〇",encoding="CP932")
Name_1=df["Name"]
Name_OK=list(sorted(set(Name_1)))

for a in range(len(Name_OK)):
    
    z1,z2,z3=[],[],[]

    j = df[df['Name'].str.contains(str(Name_OK[a]))]
    
    x1=j["X"]
    y1=j["Y"]
    
    print(x1)
    
    for b_1 in range(len(x1)):
        
        print("111")
        print(z1)
        
        for b_2 in range(len(x1)):
                    
            if b_1==b_2:
                continue

            if b_2 in z2:
                
                if b_1 in z1:
                    print(z1)
                    continue
                else:
                    print(z1)
            else:            
                z2.append(b_2)
                        
            if x1[b_1]-50 < x1[b_2] < x1[b_1]+50:
                
                if y1[b_1]-50 < y1[b_2] < y1[b_1]+50:
                    
                    z3.append(b_2)

        z1.append(b_1)
    
    
    if len(z3)>0:                       
        j.drop(df.index[z3])
        
        print(j)

for文を使用して、同じ行を組み合わせに入れないようにして、近い行を、クエリで削除していこうとしておりますが、うまくいきません。

シンプルなコードがあればうれしいです。

宜しくお願いいたします。

ppaul

2021/05/19 09:32

j = df[df['Name'].str.contains(str(Name_OK[a]))] の行で AttributeError: Can only use .str accessor with string values! となります。質問の中のコードが間違っていませんか？

行動規範の内容に同意します

回答1件

python
1df_new = df.iloc[(df['X'] - df['Y']).abs() < 50, :]

投稿2021/05/20 04:20

HelloQ

総合スコア81

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

Python Pandas 近い値のある行を削除する

関連した質問