前提
歌詞によく出てくるフレーズを1曲につき3つほど自動的に表示できるプログラムの作り方を知りたい。
実現したいこと
人気の曲にはどんな歌詞のフレーズがよく使われているのか調べたい。(ランキング化または図式化したい)
発生している問題
環境構築からプログラミング、スクレイピングなど、全てが初心者で何もかもわからない。
該当のソースコード
Python
> 環境構築からプログラミング、スクレイピングなど、全てが初心者で何もかもわからない。
環境構築からですと入門書を読まれるのが良いかと思います。
手順としては品詞分解してそれをキーに、数値を値として辞書を作り、出現順に値をカウントアップして、最後にそれを値の大きさで降順ソートすればできると思います。
言語は何でも構いませんが、品詞分解を自分でするのは大変なので、そのようなライブラリのある言語を選ぶと良いでしょう。
抽出したいフレーズが一単語とは限らない場合、少し工夫が必要になる上に速度が落ちるため、曲数によってはサーバーを借りる必要が出てくると思います。
圧縮アルゴリズムを学んでみれば、データ中の重複したデータを抽出する方法がわかります。
チンプンカンプンですか?
その場合、一度そのやりたいことは忘れて基礎からはじめましょう。
せめて言葉が通じなければ、限られた文字数での回答は不可能です。
そして大量の文字数で回答する場合、本が数冊書けるくらいの分量が必要になるため、回答者の負担も大きく、またそれが無駄な作業になる可能性も大きくなるので、誰もやりません。