前提・実現したいこと
2つのcsvファイルのある列に入っている日本語テキストの一致率を出したい.
自分の力では下のが精一杯でした.
発生している問題・エラーメッセージ
該当のソースコード
python
1import pandas as pd 2def make_dataframe(filename): 3 df = pd.read_csv(filename, encoding='utf-8', na_values='nan') 4 return df 5 6df = make_dataframe('ho.csv') 7df2 = make_dataframe('ge.csv') 8i = 0 9for i, in range(50): 10if(df['text'] == df2['text']) 11print(i)
試したこと
1つ目のcsvファイルが200件,2つ目のファイルが50件ほどテキストがあるので
for文で50回回せばいいかなとこのようになっています.
どうかお力添え頂きたいです.
回答1件
あなたの回答
tips
プレビュー