###前提・実現したいこと
python
1>>> import pandas as pd 2>>> df = pd.read_csv("test.csv") 3>>> df.shape 4(6204141, 3) 5>>> df.head() 6 item1 item2 similar 70 AAA BBB 4.820050e-05 81 CCC DDD 1.614030e-08 92 EEE FFF 3.445566e-08 103 GGG HHH 1.838947e-07 114 III JJJ 1.134076e-07
上記のような3列のデータフレームを以下のような**距離行列(類似度行列)**にする最適な方法は何でしょうか?
やはりfor文で実行すると処理が重くなるため、困っています。。。
python
1 AAA BBB CCC DDD ... 2AAA 1 4.820050e-05 0.1 0.001 3BBB 0.033 1 0.1 0.001 4CCC 1 4.820050e-05 1 0.001 5...
###試したこと
for文でやってみましたが一晩経っても終わりませんでした。。。
###補足情報(言語/FW/ツール等のバージョンなど)
- 言語はPython3です。
- pandasを使っていますが、何か解決に役立つライブラリがあればご共有ください。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/05/10 13:50
2017/05/10 14:19 編集
2017/05/13 07:20
2017/05/14 07:30