質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

Word

Microsoft WordはMicrosoftが開発した業務用の文書生成用のソフトウェアです。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

解決済

1回答

802閲覧

Word2Vecの最小単語数を設定した時の「破棄する」という意味について

tome_neko

総合スコア7

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

Word

Microsoft WordはMicrosoftが開発した業務用の文書生成用のソフトウェアです。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

0クリップ

投稿2019/11/10 15:13

現在、Word2Vecの勉強をしているのですが、最小単語数を設定すると、設定した値の回数の単語が出てこなかったら破棄されるっていうのがありますが、破棄されるの意味がよく分かりません。

そのままの言葉の意味で、大して出てこない単語は殆ど使うことがないし、メモリ使用量も増えるから、その単語を無いものとするって解釈でよろしいですか?

それとも、もっと別の意味があったりするのでしょうか?

どなたかご教授お願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

quickquip

2019/11/10 23:39 編集

> 最小単語数を設定すると、設定した値の回数の単語が出てこなかったら破棄されるっていうのがありますが どこに書いてあるのかを示すか、あるいはどのように書いてあるのか正確に引用するかしていただけないでしょうか?
tome_neko

2019/11/11 05:40

実はWord2Vecのパラメータについての論文を読んでいまして、そこに出てきたのが最小単語数というものです。 最小単語数のことが書いてある論文が載っているURLが以下となります。(IEEEに記載されているものです) https://ieeexplore.ieee.org/document/8620919 その論文の中で、書いていた文章をここに引用します。 「 Bu durumu incelemek için minimum kelime sayısı 2 seçilerek bütün derlem içinde 1 kere tekrar eden kelimeler atılmıştır. 」 「最小単語が2として選択されると、コレクション全体で1回繰り返された単語は破棄されました。」 論文がトルコ語で書いてあるので、翻訳機を使いながら読んでいたのですが、結局理解できず質問させていただいたということです。
guest

回答1

0

ベストアンサー

-min-countオプションのことであれば「その単語を無いものとする」という解釈で合っています。
意味のある単語なら何回か出現しますので、わずか数回(デフォルトは5でしたっけ)しか出てこないものは無視しよう、ということだったかと思います。

投稿2019/11/17 14:15

segavvy

総合スコア958

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tome_neko

2019/12/10 15:12

回答ありがとうございます! 返信するのを忘れてしまい、そのままでした... 疑問がすっきりできてよかったです!!
segavvy

2019/12/11 17:25

お役に立てたようで良かったです!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問