質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.34%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

データベーススペシャリスト

データベーススペシャリスト試験 (DB)は、IPA 独立行政法人 情報処理推進機構の実施している国家資格です。

Q&A

解決済

1回答

4596閲覧

Pythonでcsv時系列データの(ダウン)サンプリングの方法について

tty007

総合スコア9

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

データベーススペシャリスト

データベーススペシャリスト試験 (DB)は、IPA 独立行政法人 情報処理推進機構の実施している国家資格です。

0グッド

0クリップ

投稿2019/11/05 06:36

#前提

698504,14098,619113,278937567,8885,44,20921,0,17:31:46:181429 698504,14098,619114,278937573,8885,44,20921,0,17:31:46:204821 698505,14098,619117,278937576,8885,44,20921,0,17:31:46:220813 698506,14098,619119,278937579,8885,44,20921,0,17:31:46:234116 698506,14098,619121,278937581,8885,44,20921,0,17:31:46:251062 698507,14098,619128,278937583,8885,44,20921,0,17:31:46:272607 698507,14098,619129,278937585,8885,44,20921,0,17:31:46:289761

このようなCSVファイルがあります.一番右の列がタイムスタンプとなっているデータセットです.
使用言語はPython3.6.0です.
タイムスタンプには規則性はなく,とにかくぐるぐるプログラムを回して記録しまくっています.

#実現したいこと
上のCSVデータはかなりの狭範囲で時系列にデータを蓄積しています.ここから,0.1sごとにデータを綺麗に抽出したいです.
この場合,どのようなライブラリを使用して,どのようなコードを書けばダウンサンプリングできるのかご教授願いたいです.

日付のサンプリングを実現するコードはネット上に転がっているのですが,0.1s単位でデータを取得する物に関してはあまり文献が見つけられなかったので,Python初学者の私にはわかりませんでした.

Pythonのライブラリで便利なのはありませんでしょうか?

Pythonエキスパートのご回答お待ちしております.

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

CSVファイルをpandasにて読み込んで、100msでDataFrame.resample() するとよいのではないでしょうか。

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.resample.html

Python

1import pandas as pd 2 3# CSVデータの読み込み(ヘッダ行なし) 4df = pd.read_csv('data.csv', header=None) 5# 9列目(Col index:8)のデータをDatetime型に変換 6df[8] = pd.to_datetime(df[8], format="%H:%M:%S:%f") 7# 9列目(Col index:8)をIndexとして設定 8df = df.set_index(8) 9# 100mS毎にresampleする(新しい値としては平均値を使う) 10ret = df.resample('100L').mean() 11print(ret) 12# 0 1 2 3 4 5 6 7 13#8 14#1900-01-01 17:31:46.100 698504.000000 14098.0 619113.000000 278937567.0 8885.0 44.0 20921.0 0.0 15#1900-01-01 17:31:46.200 698505.833333 14098.0 619121.333333 278937579.5 8885.0 44.0 20921.0 0.0

投稿2019/11/05 07:53

magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.34%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問