回答率: 85.25%

質問するログイン新規登録

トップ 7に関する質問 PythonによるSQLite上での重複の削除

編集履歴

質問編集履歴

1

皆さまのご回答を踏まえた修正を行いました。

2020/06/12 07:12

投稿

スコア14

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -3,7 +3,8 @@
 Python上でCSVファイルを読み込み、SQLite3にデータベースを作成しています。
 その際、重複した行を削除しようとしているのですが、以下のSelect Distinct（変数2つ）ではうまくいきません。
 読み込むCSVは毎日更新されるので、Primary Keyによる制限をかけない方針です。
-（制限をかけると、CSVファイルそのものが読み込まれないという理解です。）
+~~（制限をかけると、CSVファイルそのものが読み込まれないという理解です。）~~
+←理解が間違っておりました。
 初めてSQLを使ったため、的外れな質問であれば恐縮です。
 よろしくお願いいたします。
@@ -14,9 +15,33 @@
 sql = """
 SELECT
     DISTINCT `column_name1`,
-    DISTINCT `column_name2`
+    ~~DISTINCT~~ `column_name2`
 FROM
     'table_name'
 """
 conn.execute(sql)
+```
+### 【追記】
+・CSVはForループで順次読み込まれます
+・重複を許してSQLに格納したのち、重複したものを消す手法は試しましたが、Lockされてしまい断念しました。
+### 【追記】該当のソースコード
+```Python3
+import sqlite3
+db_file_name = database_name
+conn = sqlite3.connect(db_file_name)
+sql1 = """
+delete   from table_name
+where    rowid not in
+         (
+         select  min(rowid)
+         from    prices
+         group by
+                 column_name1
+         ,       column_name2
+         )
+"""
+conn.execute(sql1)
 ```