目的
機械学習で学習させるデータを増やすため。
やりたいこと
以下のような文章があったとします。
__label__1, 私 は ラーメン が 好き で す 。 __label__1, 僕 は オムライス を 好き で す 。
これらを並べ替えて、以下のような新しいデータを作りたいと考えております。
__label__1, 私 は ラーメン が 好き で す 。 __label__1, 僕 は オムライス を 好き で す 。 __label__1, 私 は オムライス が 好き で す 。 __label__1, 僕 は ラーメン を 好き で す 。
やったこと ( 参考になりません。)
df = pd.read_csv('__label__1.txt',header=None,error_bad_lines=False) data = df['__label__1'] datum = [] label = '__label__1,' for i in data: sortData = sort(i) d = label + sortData datum.append(d)
以上にようにすると逆になるだけで、シャッフルできていません。
できれば自然な文章にしたいのですが、
何か良い方法はご存じないでしょうか。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2022/04/02 08:37
2022/04/02 08:38
2022/04/02 08:47