前提
独学で深層学習を勉強しています
この記事を参考にして、自前のCSVを読み込めるかを試しているところです。
pandasはほとんど理解していません。
根本的におかしな質問をしていると感じた方は、ここを調べたほうがいいとアドバイスをいただきたいです。
質問したい箇所
上記記事の以下のところになります
##説明変数の設定 print("-----説明変数--------") setsumei = DataFrame(wine_data_set.drop("quality",axis=1)) print(setsumei.head(10))
わかっている事
上記の記事で扱っているCSVはこんな感じだそうです。
一番最後の列にあるqualityというのが他の列から導きだされる結果になっているようです。
それを正解用の変数に入れてという感じだとなんとなく察しています。
発生している問題
ところが私の作ったCSVなんですが、おおよそこんな感じです。
要素1 | 要素2 | 要素3 | 要素4 | ... | 要素n | 答え1 | 答え2 | 答え3 |
---|---|---|---|---|---|---|---|---|
100 | 200 | 300 | 400 | ... | 200 | 1 | 0 | 0 |
200 | 200 | 500 | 450 | ... | 400 | 1 | 1 | 0 |
300 | 250 | 100 | 300 | ... | 200 | 0 | 0 | 1 |
800 | 200 | 350 | 50 | ... | 250 | 1 | 0 | 1 |
複数列で答えとなっています。
最終的に最後までプログラムを組んで実行するときも、3つのペアで答えが欲しいです
補足
確率的にある3事象が発生するか否かが欲しく、
答え1: 0.8947632
答え2: 0.3782974
答え3: 0.5463821
というような形の出力が最終的に出てくることを望んでいます。
追記
しばらくググったところマルチラベルのクラス分けと言われていることが分かりましたのでタイトルを変更しました。
回答1件
あなたの回答
tips
プレビュー