質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.31%
YOLO

YOLOとは、画像検出および認識用ニューラルネットワークです。CベースのDarknetというフレームワークを用いて、画像や動画からオブジェクトを検出。リアルタイムでそれが何になるのかを認識し、分類することができます。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

1回答

1677閲覧

webアプリでスマホカメラを使ったリアルタイム物体検出

escape

総合スコア0

YOLO

YOLOとは、画像検出および認識用ニューラルネットワークです。CベースのDarknetというフレームワークを用いて、画像や動画からオブジェクトを検出。リアルタイムでそれが何になるのかを認識し、分類することができます。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

0クリップ

投稿2022/11/10 03:15

編集2022/11/10 04:47

前提

学校の卒業研究でスマートフォンを使ってリアルタイムに道路標識を検出するwebアプリを作成中

実現したいこと

webアプリで起動したスマホカメラでリアルタイムに物体検出

分からないこと

・webアプリで起動したスマホカメラのリアルタイム映像をどうやって物体検出へ繋げるのかが分からない
・ある程度調べたところ、webカメラを使ったリアルタイム物体検出をしているサイトはいくつかあるがwebアプリからリアルタイム物体検出を試したサイトが見つからなかった

補足情報

webサーバはherokuを使う予定
物体検出はyolov5sを使う予定

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jbpb0

2022/11/10 05:34

> リアルタイムに道路標識を検出するwebアプリを作成中 ということは、yolov5sを動かすのはスマホではなくwebアプリ側でしょうか? 上記がyesの場合ですが、 > webアプリで起動したスマホカメラのリアルタイム映像をどうやって物体検出へ繋げるのかが分からない とは、「スマホカメラのリアルタイム映像」をwebアプリで受け取るところまではもうできてて、それをyolov5sに処理させるところが分からない、ということでしょうか?
escape

2022/11/11 00:36

そうです
jbpb0

2022/11/22 07:37

webアプリで受け取った「スマホカメラのリアルタイム映像」のデータを、 https://github.com/ultralytics/yolov5/blob/master/detect.py の115行目の「for path, im, im0s, vid_cap, s in dataset:」の「dataset」と同じ形式にして、その直前に割り込ませたらいいような気がします たとえば、動画ファイルの場合は https://github.com/ultralytics/yolov5/blob/master/utils/dataloaders.py の238行目からの「class LoadImages:」でそれを作ってて、315行目の「return path, im, im0, self.cap, s」で返してるのを、 https://github.com/ultralytics/yolov5/blob/master/detect.py の109行目の「dataset = LoadImages(...」で受け取ってます https://github.com/ultralytics/yolov5/blob/master/utils/dataloaders.py のそのあたりのコードを読んで、どんな形式にしたらいいのかを解読するか、あるいは動画ファイルで https://github.com/ultralytics/yolov5/blob/master/detect.py を動かしてみて、その時に115行目の「for path, im, im0s, vid_cap, s in dataset:」の直後で、「path」と「im」と「im0s」と「vid_cap」と「s」にそれぞれ何が入ってるかを調べて、それと同様な形式に合わせるか、してみたらいかがでしょうか
guest

回答1

0

webアプリで受け取った「スマホカメラのリアルタイム映像」のデータを、detect.py の115行目の「for path, im, im0s, vid_cap, s in dataset:」の「dataset」と同じ形式にして、その直前に割り込ませたらいいような気がします

たとえば、動画ファイルの場合は dataloaders.py の238行目からの「class LoadImages:」でそれを作ってて、315行目の「return path, im, im0, self.cap, s」で返してるのを、detect.py の109行目の「dataset = LoadImages(...」で受け取ってます

dataloaders.py のそのあたりのコードを読んで、どんな形式にしたらいいのかを解読するか、あるいは動画ファイルで detect.py を動かしてみて、その時に115行目の「for path, im, im0s, vid_cap, s in dataset:」の直後で、「path」と「im」と「im0s」と「vid_cap」と「s」にそれぞれ何が入ってるかを調べて、それと同様な形式に合わせるか、してみたらいかがでしょうか

投稿2022/11/28 03:13

jbpb0

総合スコア7658

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問