質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Q&A

2回答

674閲覧

重複を削除するプログラムについて

KOO_

総合スコア58

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

0グッド

0クリップ

投稿2022/05/14 06:31

現在ruby on railsにて作成したアプリケーションのsqliteデータベースに入るリストの中で、重複しているものを削除しようと考えております。

具体的には、下記のように、重複している場合、古いcreated_atを削除対象としようとしておりますが、現状プログラムですと、一覧が表示されるものの、削除は出来ないようです。

@customer = Customer.group(:company).where.not(industry:"A" || "B" || "C").having('count(*) >= 2').minimum(:created_at).destory_all

そこで、hashをkeyとvalueに変換し、削除を行おうと試みましたが、

customer_ids = @customer.where(company: hash.keys, created_at: hash.values).pluck(:id)

NoMethodError: undefined method `keys'とkeysに対するメソッドエラーが発生してしまいました。

一括削除を達成するにはどうすれば良いでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

y_waiwai

2022/05/14 07:12

コードを提示しよう
guest

回答2

0

どういうスキーマなのかよく分からなかったので、customersを以下として考えています。

rb

1create_table "customers", force: :cascade do |t| 2 t.string "industry", null: false 3 t.datetime "created_at", null: false 4 t.datetime "updated_at", null: false 5 end

ワンライナーで出来るかな?と考えてみましたが、複雑すぎたので諦めました。ActiveRecordらしく(Rubyらしく?)書くと、こんな感じでしょうか。

ruby

1ActiveRecord::Base.transaction do 2 Customer.group(:industry).having('COUNT(industry) >= 2').pluck(:industry).each do |industry| 3 max_val = Customer.where(industry: industry).maximum(:created_at) 4 Customer.where(industry: industry).where('created_at < ?', max_val).destroy_all 5 end 6end

重複しているindustryの一覧を元にeachでループ処理を行い、それぞれのindustryの最新の日付情報を取得して、それ以前のデータを全て削除しています。もっと良い集計方法があればいいのですが。普通にN+1問題となってしまいます。

一応、相関サブクエリを使った方法も考えてみたのですが、ActiveRecordで表現するのが厳しかったです。動作確認が出来たSQLだけ貼っておきますのでご参考までに。

sql

1DELETE FROM customers WHERE id IN ( 2 SELECT 3 id 4 FROM 5 ( 6 SELECT * FROM customers AS C1 WHERE C1.industry IN (SELECT industry FROM customers GROUP BY industry HAVING COUNT(industry) >= 2) 7 ) AS C2 8 WHERE 9 C2.created_at < ( 10 SELECT MAX(created_at) FROM customers AS C3 WHERE C3.industry = C2.industry 11 ) 12);

投稿2022/05/16 14:28

okabe-yuya

総合スコア23

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

パイプライン的なスマートなやり方ではないですが、すべてのレコードを順番に処理するとして、自分のcreated_at日時より後の自分と同じcompanyコードのレコードを削除するようなコードを繰り返すのはどうでしょうか。

投稿2022/05/14 07:48

seastar3

総合スコア2285

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問