「○○か○○でないか」という二値分類問題に取り組んでいます。そのなかで、現状として「○○ではない」というラベルの教師データが少なく、データにも偏りがあります。さらにデータを増やすのも困難なので、「○○である」というデータのみで分類器が作れないかと考えています。
現在検討し取り組んでいたのは、正解ラベル付きの教師データと未知データを混ぜてクラスタリングを行うというものでしたが、結果の解釈に困窮しています。なにか良い方法はないでしょうか?
投稿2020/02/06 08:17
「○○か○○でないか」という二値分類問題に取り組んでいます。そのなかで、現状として「○○ではない」というラベルの教師データが少なく、データにも偏りがあります。さらにデータを増やすのも困難なので、「○○である」というデータのみで分類器が作れないかと考えています。
現在検討し取り組んでいたのは、正解ラベル付きの教師データと未知データを混ぜてクラスタリングを行うというものでしたが、結果の解釈に困窮しています。なにか良い方法はないでしょうか?
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。