自然言語処理、pythonの初心者です。
環境はGoogle colabです。
機械学習でテキスト分類をしています。
データはtext classの列があり、とりあえず見よう見真似でmecab、bagofWordsをしてみて、SVMで分類器を作りました。
次に別の特徴量も作りたく思い(textの中にリンクが含まれていれば1とか0とか)、自分で調べ、bagofWordsでできた行列に新しいく作った列を追加しようと思いました。Google colabでは上記の作業をするとクラッシュしてしまいます。bagofWords行列をTruncatedSVDなどを用いて次元圧縮をすればよいのでしょうか。
kaggleに初挑戦をしており、詰まってしまいました。どうか教えていただければ幸いです。
回答1件
あなたの回答
tips
プレビュー