はじめて質問させて頂きます。
趣味でkaggle 、SIGNATEのテーブルコンペ、画像コンペに参加したいと考えております。
まずは平均程度のスコアをとれるようになりたいと思っており、ゆくゆくは上位も狙っていきたいです。
それらのレベルに到達するまでに使用する本、学習方法を教えていただきたいです。
現在はpythonの基礎を学習し、「スッキリわかるPythonによる機械学習入門」を終えたところです。今後読む本として、以下を考えております。
- ゼロから作るdeep learning
- Kaggleで勝つデータ分析の技術
- PythonではじめるKaggleスタートブック
- [第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践
これらで学習を行い、コンペで実践を積むことにより平均程度のスコアをとれるようにはなるでしょうか。
「この本は使わないほうがいい」、「この本がおすすめ」など色々お聞きしたいです。
またその後、上位を狙うにあたって、おすすめの教材や知識を学ぶ方法についてもお聞かせいただきたいです。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
回答7件
#1
総合スコア231
投稿2024/04/03 10:47
[香車]東上☆あらし☆海美「
ジェネリックな回答として、
『本を沢山読み、コードを沢山書いて、人にアドバイスできるようになる』と、
ようやく、平均程度のスコアをとれるようになります。
人にアドバイスを求めるようでは、上位は狙えません。
」
#2
総合スコア231
投稿2024/04/03 15:45
編集2024/04/03 22:33[香車]東上☆あらし☆海美「
なんか、logres_Fan さん、Akashi_Tako_Tai さんのリアクションが読めないのですけど
」
追記:
[香車]東上☆あらし☆海美「
リアクションが読めるようになりました。
」
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
#4
総合スコア0
投稿2024/04/03 22:29
編集2024/04/03 22:35umimi様 logres_Fan様
ご回答ありがとうございます。
このサイトに不慣れなもので、申し訳ございません。
本をたくさん読むことが重要なんですね。
たしかに、今はあまりあれこれ考えずにとにかく知識をインプットすることが大切かもしれません。
いろいろな本を読んで実践し、慣れていきたいと思います!
あと、上位云々はまだまだ先の話ですね。
アドバイスを求めているようではそこまでたどり着けないというのはおっしゃる通りだと思います。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
#5
総合スコア673
投稿2024/04/05 08:34
(signateチュートリアルで100位程度なので大したレベルではありませんが参考になれば)
本自体いい悪いまではわかりませんが、それぞれ対象としている読者が異なると思います。
ゼロから作るdeep learning
これは機械学習向けのライブラリ(scikit-learnやTensorFlow、PyTorchなど)を使用せず機械学習を行う方法にフォーカスしているため、予測を行う計算ロジック(y=ax+bのような線形回帰や最低の誤差を求めるための最急降下法の計算式の説明とプログラムでの実装方法)がメインの話になると思います。
どちらかというと自分たちが使っているライブラリがどのように実装(記述)されているかの理解や自分独自でライブラリを作りたい人向けだと思います。
Kaggleで勝つデータ分析の技術
表紙にキーワードがあったので表紙を見た程度ですが、kaggleを使ったことがある人向けでこれから精度を上げるテクニックを学びたい人向けの本かなと思います。
表紙の後に本書で取り扱うことと扱わないことが書いてありますが、kaggleは使用したことがある前提のような雰囲気でした。(kaggleの使い方を説明するとは一切なく、精度を上げるテクニックを紹介ということが書かれていました。これはkaggle以外のコンペでも応用できる内容だと思います)
PythonではじめるKaggleスタートブック
(読んだことはないですが)これは本格的にコンペに参加する手順を説明する内容だと思うので精度を上げる方法などの記述は少なく、どちらかというとどのようにkaggleのコンペに参加するかを解説している本だと思います。
(ものが古いと現在のkaggleの機能や見た目ところなりうまく進めることができないかもしれません)
[第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践
これはコンペというよりはデータ分析に重きを置いている本だと思います。
コンペはコンペなりにやり方があります(昔の知識ですが他人が共有している情報を活用するなど)が、これは完全にデータ分析に焦点を当てたものだと思います。
なので精度を上げるというよりかは、知らず知らずに使用していた分析手法について理解を深めたり、仕事や専門職としてデータ分析をする人が分析手法を理解する本の様に思えます。
それぞれニュアンスが微妙でどれも同じに見えるかもしれませんが、個人的には左から
PythonではじめるKaggleスタートブック > Kaggleで勝つデータ分析の技術 > Python機械学習プログラミング 達人データサイエンティストによる理論と実践 > ゼロから作るdeep learning
のような流れで始めるものなのかなと思います。
Python機械学習プログラミング 達人データサイエンティストによる理論と実践からはコンペ(精度を競う)というよりは理論的な話になると思うので、Kaggleで勝つデータ分析の技術までやってみて深く分析手法に関して知りたければ手を出すし、とにかくスコアを上げたいのであれば別の本を読んだり、するのが良いのかなと思います。
いきなりKaggleで勝つデータ分析の技術から読み始めてもまあいいかなと思いますが(知らないことがあれば随時調べる)、実際にそれぞれの本を手に取って読んでみて取り組むかは決めるのが良いと思います。
実際に書店に行きにくい場合は、書籍の目次や試し読み部分を見てみてまったく意味が分からなければ(特に上に挙げた右側の本がこれにあたると思います)やめた方が良いですし、簡単すぎて買うまでもない(特に左側)ものであれば候補から外すのが良いと思います。
あとは、レビューにどんな人に良さそうだよというコメントが結構あったので、それを見て判断するのもよいと思います。
順番だけうまく読めば挙げてもらっている本でも平均にはいくのではないかなと思います。
その後に関しては、本というよりは書籍では集められないインターネット上の情報やxでデータ分析を行っている人をフォローして情報を仕入れるとかの方がいいと思います。
一般的にはkaggleなどで公開されているスコアが高いnotebookを読み解いて自分んと何が違うのかを考えたり、ブログやxでみたほかの人のやり方を取り入れたりするのが良くある方法かなと思います。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
#6
総合スコア2218
投稿2024/04/06 02:59
1-4はどれも良い本と思います。
KAGGLEならばあと『THE KAGGLE BOOK』が良いかと
あとはネット上に記事やKagleのSlackもあるらしいですが上位を狙うならば必死にやるしかないでしょうね。
(私は必死になれず)
KAGGLEも最近は分析テーマが広がってきたので、それらを知るにはデータ分析の分野の本を幅広く紹介した私の記事が参考になるかも
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
#7
総合スコア0
投稿2024/04/09 08:49
THE KAGGLE BOOKは一度書店で確認してみます。
「2023年版データ分析の100冊」見せていただきました。非常に参考になります。
xやブログなども参考にしていきたいと思います。
皆様有益情報をいただき、本当にありがとうございます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。