Kaggleを使用したことがない初心者です。
画像分類のコンペというのはあくまで例と考えていただけると有り難いです。
これまでにいろいろな深層学習のモデルが提案されてきましたが、それらをそのまま使用することで上位を狙うことは難しいのでしょうか?
皆さん自分でモデルを考えているのでしょうか?そうだとすると、どのような流れや考え方でモデルを作成しているのでしょうか?
検討外れなことを聞いていたら申し訳ないです。回答よろしくお願いします。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
回答2件
0
ベストアンサー
画像系のコンペでは、自作というかよく使われるモデルをコンペ用にカスタマイズするといったことはよくあります。
画像なので、GBDTをなどを使う人はあまり(ほとんど?)見ません。
やはりCNN系が多いですね。
Kaggle のコンペサイトのDiscussion 内にはかならず、「1st place solution」「2nd place solution」 ... と上位者の解法が並んでいますのでそちらをご覧になられるといいかもしれません。
例 画像系コンペ例
投稿2020/11/24 02:16
編集2020/11/24 04:38総合スコア42
0
「モデル」という言葉の意味にもよりますが、おそらく質問者様の言われている定義だと、回答は「違います」となります。なお、質問者様の要望通り、画像系も引き合いに出しながら、機械学習一般の範囲で回答しています。
機械学習の大きな流れは以下のようになります(強化学習といった分野は除く)。完全に直線的な流れではなく、状況によって前段階に戻って改善したりします。
- 特徴量の作成
- モデルの作成
- モデルの評価
- モデルのチューニング
- アンサンブル
ここで最も上位陣で差がつくのは、最初の「特徴量の作成」の部分です。モデルの作成の段階では、基本的にはGBDTというモデルをほぼ選択します。GBDTとしては、以前はxgboost、最近はLightGBMが採用率が高いそうです。
よって、新しいモデルを開発したりすることはぼぼありません。
ディープニューラルネットの層を工夫したり、といったレベルも質問者様の「自作のモデル」に該当するのであれば、時々はやっています。なお、ディープニューラルネットのフレームワークは「層を工夫したり」の表現力が高いため、工夫のレベルはさまざまです。パラメータや積み重ねの組み合わせを変えるレベルから、層そのものをカスタムしたり、複数の層のアウトプットを合流させたり、といろいろできます。CNNもRNNもLSTMも、乱暴に言えば「層を工夫したり、といったレベル」であり、どこからが「新しいモデル」かはあいまいです。Kaggleで作られた新たな「工夫」が、流行って名前がつけられ、新しいモデルとして認知されることも、ありえるでしょう。
追記: 画像系はCNNがメインなので、上記の「ディープニューラルネットの層を工夫したり、といったレベル」が主流ですね。fkubota様の回答通りです。
おそらく、既存の工夫レベルを超えた、いわゆる「新しいモデル」を開発するといったことは、企業や大学等の研究機関が(まれに)行うことで、Kaggleのようなリソースと期間が限られている実践に近い場ではあまり行われないものと思います。
なお、回答にあたっては、書籍「Kaggleで勝つデータ分析の技術」、Qiita等のKaggle関連記事複数を参照して、回答者の解釈を一部入れて記述しています。ただし、Kaggleそのものを深く見ているわけではないため、最新の状態を正確に表現している保証はありません。
補足
三中信宏「統計思考の世界」では、「計算を考える前にデータを見ることが重要」「とにかくそのまま適当な統計ツールに食わせてその出力を排泄させてみることは、本書をもって全力で阻止したい愚行」(原文を回答者にて文意を損なわない範囲で一部短縮)と主張しています。「モデル」は単なる道具です。「何か素晴らしいモデルを開発することが機械学習のポイントである」というイメージは崩した方がよいと思います。
投稿2020/11/23 22:38
編集2020/11/24 22:58総合スコア3266
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/11/25 11:08 編集
2020/11/25 15:56
2020/11/25 16:13
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/11/25 16:11
2020/11/26 00:28
2020/11/26 04:38
2020/11/26 04:45
2020/11/26 05:10