質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

YOLO

YOLOとは、画像検出および認識用ニューラルネットワークです。CベースのDarknetというフレームワークを用いて、画像や動画からオブジェクトを検出。リアルタイムでそれが何になるのかを認識し、分類することができます。

PyTorch

PyTorchは、オープンソースのPython向けの機械学習ライブラリ。Facebookの人工知能研究グループが開発を主導しています。強力なGPUサポートを備えたテンソル計算、テープベースの自動微分による柔軟なニューラルネットワークの記述が可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

812閲覧

RICOH thetaZ1 を用いてリアルタイム人認識

kakakaka

総合スコア12

Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

YOLO

YOLOとは、画像検出および認識用ニューラルネットワークです。CベースのDarknetというフレームワークを用いて、画像や動画からオブジェクトを検出。リアルタイムでそれが何になるのかを認識し、分類することができます。

PyTorch

PyTorchは、オープンソースのPython向けの機械学習ライブラリ。Facebookの人工知能研究グループが開発を主導しています。強力なGPUサポートを備えたテンソル計算、テープベースの自動微分による柔軟なニューラルネットワークの記述が可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/07/25 08:48

困っていること

ricoh thetaz1で人検知を行おうと思い、yolov3を実装してみたのですが、外部カメラとしてUSBでthetaをつなげてみた結果以下のようになりました。
イメージ説明

全方位カバーして出力したいのですが300度くらいで切れてしまいます。

画像サイズの変更をしたいのですがthetaの解像度である3840,1920で無理やり合わせて実装してみたらパソコンがスリープしてしまうという状況です。
そもそも、pythonもしくはyolov3では360度でのキャプチャはできないのでしょうか?

MPC-HCでカメラ動画のみを出力させると以下のようになります(全方位カバーできている)
イメージ説明

二枚の写真の切れ目を見ると一枚目が全方位カバーできていないのが分かります。

python実装でもこのように出力させたいです。
コードのどの部分を変えればよいのか知りたいです。
説明下手で申し訳ないですがどなたか意見を下さいよろしくお願いします。

python

1from __future__ import division 2import time 3import torch 4import torch.nn as nn 5from torch.autograd import Variable 6import numpy as np 7import cv2 8from util import * 9from darknet import Darknet 10from preprocess import prep_image, inp_to_image 11import pandas as pd 12import random 13import argparse 14import pickle as pkl 15 16def get_test_input(input_dim, CUDA): 17 img = cv2.imread("imgs/messi.jpg") 18 19 img = cv2.resize(img,(inp_dim, inp_dim)) 20 img_ = img[:,:,::-1].transpose((2,0,1)) #転置 21 img_ = img_[np.newaxis,:,:,:]/255.0 #次元を追加 22 img_ = torch.from_numpy(img_).float() 23 img_ = Variable(img_) 24 25 if CUDA: 26 img_ = img_.cuda() 27 28 return img_ 29 30def prep_image(img, inp_dim): 31 """ 32 Prepare image for inputting to the neural network. 33 34 Returns a Variable 35 """ 36 37 orig_im = img 38 dim = orig_im.shape[1], orig_im.shape[0] 39 img = cv2.resize(orig_im, (inp_dim, inp_dim)) 40 img_ = img[:,:,::-1].transpose((2,0,1)).copy() 41 img_ = torch.from_numpy(img_).float().div(255.0).unsqueeze(0) 42 return img_, orig_im, dim 43 44def write(x, img): 45 c1 = tuple(x[1:3].int()) 46 c2 = tuple(x[3:5].int()) 47 cls = int(x[-1]) 48 label = "{0}".format(classes[cls]) 49 color = random.choice(colors) 50 cv2.rectangle(img, c1, c2,color, 1) 51 t_size = cv2.getTextSize(label, cv2.FONT_HERSHEY_PLAIN, 1 , 1)[0] 52 c2 = c1[0] + t_size[0] + 3, c1[1] + t_size[1] + 4 53 cv2.rectangle(img, c1, c2,color, -1) 54 cv2.putText(img, label, (c1[0], c1[1] + t_size[1] + 4), cv2.FONT_HERSHEY_PLAIN, 1, [225,255,255], 1); 55 return img 56 57def arg_parse(): 58 """ 59 Parse arguements to the detect module 60 61 """ 62 63 64 parser = argparse.ArgumentParser(description='YOLO v3 Cam Demo') 65 parser.add_argument("--confidence", dest = "confidence", help = "Object Confidence to filter predictions", default = 0.25) 66 parser.add_argument("--nms_thresh", dest = "nms_thresh", help = "NMS Threshhold", default = 0.4) 67 parser.add_argument("--reso", dest = 'reso', help = 68 "Input resolution of the network. Increase to increase accuracy. Decrease to increase speed", 69 default = "160", type = str) 70 return parser.parse_args() 71 72 73 74if __name__ == '__main__': 75 cfgfile = "cfg/yolov3.cfg" 76 weightsfile = "yolov3.weights" 77 num_classes = 80 78 79 args = arg_parse() 80 confidence = float(args.confidence) 81 nms_thesh = float(args.nms_thresh) 82 start = 0 83 CUDA = torch.cuda.is_available() 84 85 86 87 88 num_classes = 80 89 bbox_attrs = 5 + num_classes 90 91 model = Darknet(cfgfile) 92 model.load_weights(weightsfile) 93 94 model.net_info["height"] = args.reso 95 inp_dim = int(model.net_info["height"]) 96 97 assert inp_dim % 32 == 0 98 assert inp_dim > 32 99 100 if CUDA: 101 model.cuda() 102 103 model.eval() 104 105 videofile = 'video.avi' 106 107 cap = cv2.VideoCapture(1) 108 109 assert cap.isOpened(), 'Cannot capture source' 110 111 frames = 0 112 start = time.time() 113 while cap.isOpened(): 114 115 ret, frame = cap.read() 116 if ret: 117 118 img, orig_im, dim = prep_image(frame, inp_dim) 119 120 im_dim = torch.FloatTensor(dim).repeat(1,2) 121 122 123 if CUDA: 124 im_dim = im_dim.cuda() 125 img = img.cuda() 126 127 128 output = model(Variable(img), CUDA) 129 output = write_results(output, confidence, num_classes, nms = True, nms_conf = nms_thesh) 130 131 if type(output) == int: 132 frames += 1 133 print("FPS of the video is {:5.2f}".format( frames / (time.time() - start))) 134 cv2.imshow("frame", orig_im) 135 key = cv2.waitKey(1) 136 if key & 0xFF == ord('q'): 137 break 138 continue 139 140 141 142 output[:,1:5] = torch.clamp(output[:,1:5], 0.0, float(inp_dim))/inp_dim 143 144# im_dim = im_dim.repeat(output.size(0), 1) 145 output[:,[1,3]] *= frame.shape[1] 146 output[:,[2,4]] *= frame.shape[0] 147 148 149 classes = load_classes('data/coco.names') 150 colors = pkl.load(open("pallete", "rb")) 151 152 list(map(lambda x: write(x, orig_im), output)) 153 154 155 cv2.imshow("frame", orig_im) 156 key = cv2.waitKey(1) 157 if key & 0xFF == ord('q'): 158 break 159 frames += 1 160 print("FPS of the video is {:5.2f}".format( frames / (time.time() - start))) 161 162 163 else: 164 break 165

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問