工場に設置した設備からとったログcsvファイルを処理しており、そのファイルのデータベース化について教えていただけないでしょうか?
ここまでやったこと
工場のある工程で、1バッチ(1回の製造サイクル)毎に10個のセンサーから各々csvファイルが出てきます。Pandasを利用して、このcsvファイルを複数バッチ分前処理して、1つのDataFrameにまとめるところまでは完了しました。
困っていること
csvファイルは、一つのフォルダに人手でコピーしているのですが、次第に増えてきています。前処理は全csvファイルを読んで行うので、次第に処理が重くなっていきます。
実施したいこと
1、管理上、すべてのcsvファイルは1つのフォルダに保存したい(ファイル名でバッチ番号とセンサ名は識別可能)
2、全バッチ・全センサを統合したDataFrameをSqliteに格納にしたい
3、新しいバッチ分のcsvファイルが格納されたときは、新しいバッチ分だけPandasで前処理し、2に追加したい。
SQLに詳しくないのですが、上の太字部分をどう実現したらいいでしょうか?
今考えている流れ
イメージとして、以下を考えています。
1、ファイル名からバッチ番号とセンサ名を取得
2、SQLを使って、データベースに格納されているバッチ番号とセンサ名を取得
3、1と2を比較し、前処理すべき対象csvを特定
4、対象csvをpandasで処理し、Insertでデータベースに追加
SQLを使ったことがないので、この流れで問題ないでしょうか?
こういう方がよりシンプルにできるよ!などアドバイスいただけたら幸いです。
回答2件
あなたの回答
tips
プレビュー