質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.63%

np.deleteを使ってデータを書き換えたい

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 511

OSV

score 130

コードはデータの中の外れ値を見つけて削除するというものです。
for文を回して条件に合わなければnp.deleteでデータから削除したいのですが、dumpしたファイルを見直してもdeleteされていませんでした。

for文で条件に合わない(i,j)の組をリストにappendし、for文の外でnp.deleteを実行するというような方法も試してみましたが失敗しました。
そもそもnp.deleteの使い方が間違っているのでしょうか。
当方プログラミング1週間目のド素人なので、どなたかご教授いただければ幸いです。

def process() :

    import numpy as np
    import joblib

    data = joblib.load('data1')
    l1 = len(data)
    coodinate = []
    for i in range(l1) :

        bridge = data[i][:,2]
        sample = data[i][:,3]

        Q3_b, Q1_b = np.percentile(bridge, [75, 25])
        IQR_b = Q3_b - Q1_b

        Q3_s, Q1_s = np.percentile(sample, [75, 25])
        IQR_s = Q3_s - Q1_s

        outlier1_b = Q3_b + 1.5*IQR_b
        outlier2_b = Q1_b - 1.5*IQR_b

        outlier1_s = Q3_s + 1.5*IQR_s
        outlier2_s = Q1_b - 1.5*IQR_s

        l2 = len(sample)
        for j in range(l2) :
            if bridge[j] > outlier1_b or bridge[j] < outlier2_b or sample[j] > outlier1_s or sample[j] < outlier2_s :
                    np.delete(data[i],j,0)
                    print(i,j)
            else :
                pass
    joblib.dump(data,'data_normalized')

process() 


np.deleteを使うのは諦め、以下のように書き換えました。

for j in range(l2) :
            if bridge[j] > outlier1_b or bridge[j] < outlier2_b or sample[j] > outlier1_s or sample[j] < outlier2_s :
                pass
            else :
                list_i.append(data[i][j])
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

0

コードを詳しく追ってはいませんが、使い方が間違っているのは確かなようです。

Return a new array with sub-arrays along an axis deleted
numpy.delete — NumPy v1.15 Manual

単に呼び出しただけでは、元の配列に対して何の副作用も起こしません。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/11/23 15:39 編集

    回答ありがとうございます。np.deleteのでは上手くいかなかったので、条件に合わないリストを削除するのではなく、合うものだけを空のリストに加えるというように書き換えることで解決しました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.63%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る