標記の件で教えていただきたいことがあります。
https://teratail.com/questions/210098
上記より、テキストデータをCountVectorizerにてベクトルにする方法を教えていただきました。
変換したベクトルデータはスパースマトリックス形式です。これをdataframeに変換することを考えています。
例えば下記のようなスパースマトリックスがあったとします。
[[0 0 0 0 0 0 0 0 1 0 1 1 0]
[1 1 1 0 0 0 0 0 0 0 0 0 0]
[0 0 0 1 0 0 0 0 0 1 0 0 1]
[0 0 0 0 0 1 0 1 0 0 0 0 0]
[0 0 0 0 0 0 0 0 0 0 0 0 1]
[0 0 0 0 1 0 1 0 0 0 0 0 1]]
これを、そのままpd.DataFrame
をしてしまうと、
|0|1|2|3|4|5|6|7|8|9|10|11|12|13|
|:--|:--:|--:|
|0|0|0|0|0|0|0|0|0|1|0|1|1|0|
|1|1|1|0|0|0|0|0|0|0|0|0|0|0|
|0|0|0|1|0|0|0|0|0|0|1|0|0|1|
|0|0|0|0|0|1|0|1|0|0|0|0|0|0|
|0|0|0|0|0|0|0|0|0|0|0|0|0|1|
|0|0|0|0|1|0|1|0|0|0|0|0|0|1|
上記のようなデータになります。
これを、
11100000000000 | |
00010000001001 | |
00000101000000 | |
00000000000001 | |
00001010000001 |
みたいなふうに連結するように変換することを考えています。
このようなことは可能でしょうか。
どうぞよろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/09/08 03:50
2019/09/09 07:22 編集