質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

6186閲覧

複数のCSVファイルを用いた機械学習をしたいのです

arumakan

総合スコア7

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2020/03/19 09:01

前提・実現したいこと

Pythonで機械学習の勉強を始めて1か月です。

複数の波形を数値化したCSVファイルがあります。
その複数の波形パターンが一つの事象を示します。
つまり一つのCSVファイルが一つの事象を表しています。
一つの列が一つの波形、行が時間経過を示しています。
このファイルが大量にあります。
これを機械学習にかけて波形から事象を予測する分類モデルを作成したいのです。

irisとかTitanicなどの練習データでは1行のデータにそれぞれ正解がついていて、
それを機械学習にかけるモデルはみられるのですが、
今回の様に行列全体を一つの正解として扱いたい場合にはどのようにすればよいのでしょうか。

考えられるのは、
A. 行列を1次元に変換する
B. 全てのファイルを統合し三次元のndarrayとして処理する
ですが、それが可能か、可能としてもどうやって大量のCSVを統合すればよいのかわかりません。
同様の処理をわかりやすく説明しているサイト、書籍などあれば教えていただけませんでしょうか。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hoshi-takanori

2020/03/19 18:58

目的変数が行列(サイズは?)になるとして、説明変数は何ですか?
arumakan

2020/03/20 01:27 編集

お返事ありがとうございます。 目的変数は10*1000程度の行列、説明変数は5種類くらいのカテゴリデータです。 全部で300個ほどCSVファイルがあります。
DataAnalOjisan

2020/03/23 08:24

確認したいのですが 「これを機械学習にかけて波形から事象を予測する分類モデルを作成したい」のであれば 複数のCSVファイルによって構築される波形データの行列が説明変数に対応すると思うのですが,そうではないのでしょうか?
arumakan

2020/03/23 12:39 編集

お返事ありがとうございます。 説明がわかりにくくてすみません。おっしゃる通りだと思います。 例えばmnistを用いた手書きの数字の自動認識では、目的変数は濃淡を数字化した二次元の行列、説明変数は0-9の数字になると思います。 今回のタスクでも同様に、二次元の行列をカテゴリーデータに分類したいのです。 波形を統合して新たな波形を構築することなどは考えていません。 私が勉強したmnistのモデルではこの行列をpandasで一次元化して処理していたのですが、他の方法がないか考えているところです。
guest

回答1

0

ベストアンサー

MNISTを例に挙げるのであれば,画像を2次元の行列のまま処理する手法として,畳み込みニューラルネットワークが挙げられます。
一方で,arumakanさんの扱うデータは時系列データであるようですので,2次元の行列を入力としたいという目的の背景には,一定の時間幅を持った波形データの行列で分類を行いたいというモチベーションがあるのだと推察します。
その場合は,LSTMやGRUといったリカレントニューラルネットワークを用いた分類器を作成することがおすすめです。
多変量LSTMについて紹介している以下のようなサイトを参考にしてみてはいかがでしょうか?
https://qiita.com/tizuo/items/b9af70e8cdc7fb69397f
リカレントニューラルネットワークについて解説している書籍としては以下のものがありますが,多変量LSTMについては扱っていなかったように記憶しています。
「詳解ディープラーニング TensorFlow/Keras・Pytorchによる時系列データ処理」

投稿2020/03/23 23:10

編集2020/03/23 23:14
DataAnalOjisan

総合スコア49

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

arumakan

2020/03/26 10:11

とてもご丁寧にお返事くださりありがとうございます。 CNN/RNNどちらも比較しながらやってみようと思います。 参考になる資料もご案内くださりありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問