文章の数値化(ベクトル化？)をしたい

前提・実現したいこと

　StackGANなどを応用すれば、喋らせたい文章を入力すると、それに対応する音声を出力してくれるシステムが構築できると考えた。
イメージとしてはVOICEROIDのようなもの。

発生している問題・エラーメッセージ

　数値化のためにWord2Vecを実装したが、このモデルを使って文章を数値化する方法がわからない。

python
1vectors = word2vec_model.to_vector(text)

のように、モデルに文章を入力して、それを数値化したものを出力させるにはどうすれば良いか分からない。

試したこと

どう検索すれば良いのか分からないので質問を投稿しました。
解説記事だけでも良いので投げてくれると助かります。
そもそもWord2Vecがこの目的に向いていないのかどうか。向いていないなら、どういった手法が向いているのか、なども教えてくださると助かります。

補足情報（FW/ツールのバージョンなど）

OS:　Windows10
IDE:　PyCharm
Python3.6

行動規範の内容に同意します

回答1件

ベストアンサー

word2vecについては
https://qiita.com/kenta1984/items/93b64768494f971edf86
のサイトに詳しく書いてあります。
このサイトではwikipediaの言語データを使用していますが、恣意的に違うデータを使用することもできると思います。
単語をベクトルかするのですが、それの応用として文章もベクトルにします。
このサイトではベクトルのサイズを200次元にしていました。これについては自分の好きな次元にできます。
裏の数学モデルについて知るにはword2vecと調べるといいと思います。
http://tkengo.github.io/blog/2016/05/09/understand-how-to-learn-word2vec/
このサイトは個人的には分かりやすかったと思います。