3次元点群(3D Point Clouds)のPointNetに関する質問です。
STNを構成する部分、コード11行目からのgithub(https://github.com/fxia22/pointnet.pytorch/blob/master/pointnet/model.py)
の14行目では、self.conv1 = torch.nn.Conv1d(3, 64, 1)
という畳み込み層が定義されていますが、
これは右辺部分の引数(3, 64, 1)は(入力次元数,出力次元数,カーネルサイズ)であっていますでしょうか?
また、上記が正しい場合カーネルサイズを1として次元を増やすというのはどのようなことなのでしょうか?
一方で、次元数は関係なく、3次元のx個の点を持つ点群のチャネルを3つから64つにしているということなのでしょうか?
また、191行目のsim_data = Variable(torch.rand(32,3,2500))では、2500個の点を持つ3次元のデータを32個ランダムに生成するという理解であっていますでしょうか?
二次元の畳み込みは理解できるのですが、三次元点群の畳み込みに関して理解ができず困っています。
少し詳しく教えていただけると幸いです。よろしくお願いいたします。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。