質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

1回答

719閲覧

ユーザが入力した文字列と画像を入力として、文字列と画像がどれくらいマッチしているかを返す方法を探しているのですが、使えそうなapiもしくはライブラリを知っている方がいたら教えていただきたいです。

sss_tommy

総合スコア7

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2021/11/04 03:00

編集2021/11/04 03:50

ユーザが入力した文字列と画像を入力として、文字列と画像がどれくらいマッチしているかを返す方法を探しているのですが、使えそうなapiもしくはライブラリを知っている方がいたら教えていただきたいです。
例えば、文字列が"犬"で、画像が犬の画像なら高いスコアを返すといった感じです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

y_waiwai

2021/11/04 03:29

どういう理屈でマッチの度合いを測るんでしょうか。 そこらへんを詳しく説明しよう
guest

回答1

0

まるでわからん!と質問を出す人がとてもできる内容とは思えませんが、
ザーッと思うところを書きます。
多分素直に実装すると大体誰がやっても大筋はこうなると思います。

入力文字の方から
1. 形態素解析
入力が文字なのか、文章なのか、はたまた犬にしてもヨークシャーテリアだったり柴犬だったりもあり得ます。Dogかもしれません。まず考えないといけないのは文章なのか単語なのかが入ってきたときに、文字列全体で何を言いたいか機械に理解させないといけません。
日本語であればMeCabの形態素解析は必須でしょう。

2. 入力した文字の理解
解析した結果をLSTMにぶち込んで、それが何を言いたいのか理解させる必要があると思います。

続いて画像
3. 画像を認識させる必要があります。一つだけ大きく映るのか、2つ以上映るのかわかりません。一つであれば普通のCNNで良いと思います。複数映るのであればYOLOのようなものか、もっと精度を上げたいのであればFaster RCNNから発展していったFPNのしっかりしたモデルを使えばいいと思います。この中で、何かが複数検出されたら、それの最大のものを使うのか、多数決をするのか、適当な方法で捌けばいいと思います。

比較
4. 2の結果と3の結果をWord to vectorみたいなもので集約できていれば、ベクトルの距離を出して終了です。クラス情報とスーパークラス(ヨークシャーテリアと犬)のような比較であれば、softmaxのパーセントの不一致度か何かで出せばいいと思います。

「おめーその説明はちげーよ」とマサカリを投げられる方であれば、その方法で実装ください。
「わからん」という方であれば、この一連の文章からキーワードを抽出して検索して、具体的な質問に書き換えてた方がイイです。

投稿2021/11/04 12:31

編集2021/11/04 22:34
退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問