SQLite形式でデータベースを作り、データの前処理をするためにPandasのDataFrameに読み込もうとしています。ただ、この読み込みに非常に時間がかかって困っております。
周波数×時間の構造を取るデータのため、列数が多く、大きさとしては1000列×24万行というデータです。また、同じdbファイルには同様のデータが10テーブルほどあります(ファイルは1つだが、テーブルは分けています)。
以下コードのように、単純なselect * でも読み込みに数分かかってしまう状況です。なお、コンソールからselect * を実行すると3秒程度で読み込めます。
Python
1import pandas as pd 2import sqlite3 3 4with sqlite3.connect('master.db') as conn: 5 df = pd.read_sql_query(sql=f'select * from table', con=conn, index_col='time')
直接の回答ではなくても、この種類のデータならこのSQLを使った方がいいという回答でも大変助かります。
回答1件
あなたの回答
tips
プレビュー