質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

91.03%

  • 機械学習

    481questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

  • Chainer

    94questions

    Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。

ポートフォリオのような目的変数での機械学習について

解決済

回答 2

投稿

  • 評価
  • クリップ 1
  • VIEW 212

mashiroyuya

score 14

機械学習でポートフォリオ作成のようなものを目的としていて正解データを買うなら1, 買わないなら 0で
[0,0,1,1,1,0] みたいなベクトルを目的変数と
する時の活性化関数と損失関数って何を使えばいいのですか?

現在Chainerで上記のようなデータを学習しようと思っているのですが, 活性化関数と損失関数をどうしようか悩んでいます.

softmax_cross_entropy でやろうかとも思いましたが, chainerのsoftmax_cross_entropyは分類するときに上記のような 0,1 のベクトルではなく, 0,1,2,... のような数(スカラー)で分類しているものを目的変数としているようです.

僕のやりたいものは[0,0,1,1,0]のように1が一つとは限らないのでスカラーにしてしまうとパターン数が多すぎて無理です.

このような場合はどのような活性化関数と損失関数を使えば良いのでしょうか?  
機械学習についてはまだ初心者でChainerも今日使い始めたばかりですが、どうかご教授お願いします.

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • Takahito_Ogawa

    2017/11/20 04:17

    「僕のやりたいものは[0,0,1,1,0]のように1が一つとは限らないのでスカラーにしてしまうとパターン数が多すぎて無理です.」という箇所に関して、2つ質問があります。Q1.「無理です」というのは何が無理なのでしょうか。パターンを書き出すことが無理なのか、スカラーにした場合に学習に必要な十分のデータを用意することが無理なのか、はたまたそれ以外の何かなのかわかりません。Q2.パターン数が多すぎるとなぜ無理だと考えたのでしょうか。この2点に関して回答をいただけると適切な回答をご用意できるかと思います。

    キャンセル

  • mashiroyuya

    2017/11/20 07:35

    修正依頼ありがとうございます。 Q1 無理というのは 目的変数となる [0,1,1,0, ... 0] のようなベクトルが実は30次元と高次元であるのでパターンが2^30個ありとても多いので スカラーで書き下せないということと、 それを満たすデータを十分用意できないという2つの意味です。 なのでスカラーに書き直すのは難しいと考えました。

    キャンセル

回答 2

+2

sigmoid と sigmoiod_cross_entropy でしょうね。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/11/29 21:56

    目的変数の1の数に上限があるなどの束縛条件がなければ、それぞれの項目について独立に推定できるので30個のバイナリ予測になるように感じます。
    目的変数間に相関がある場合、学習器として一緒に学習すると精度が上がるような報告があったような気がするので、その場合はsigmoid_cross_entropyは的確かと思われます。

    キャンセル

  • 2017/11/30 19:18

    なるほど30個のバイナリ予測と見れば良いのですか。ありがとうございます。

    キャンセル

checkベストアンサー

0

予測対象がOne-Hotで示される配列(ベクトル)ということなのでsoftmax系は使わないほうがいいかと思います。Softmax関数は、配列(ベクトル)の各要素に該当する確率を算出するものです。そのため、配列のうち『最も買うべきもの』を予測するモデルがあればsoftmax系は有用ですが、本問題は各要素独立に判定することを目標としているようなのでお勧めしません。
結果として活性化関数にはsigmoid、コスト関数にはcross_entropyというのが無難ということになります。なお、活性化関数には、tanh関数やRelu関数などがあるそうなので、いろいろと試してみるといいかもしれません。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/11/30 19:16

    やはりsigmoidですか. ちょっとやってみます. ありがとうございました.

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 91.03%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • 機械学習

    481questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

  • Chainer

    94questions

    Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。