回答編集履歴

8

 

2023/02/05 01:45

投稿

退会済みユーザー
test CHANGED
@@ -30,6 +30,9 @@
30
30
  たとえば、FacebookresearchがApacheライセンス2.0(要旨:商用OK、コード開示義務なし、ただしクレジットの表示は必要)で公開している[SlowFast](https://github.com/facebookresearch/SlowFast)はどうでしょうか?
31
31
 
32
32
  ファイルがでかくて画像をアップロードできませんでしたが、[同リポジトリのGIF画像](https://github.com/facebookresearch/SlowFast/raw/main/demo/ava_demo.gif)を見て頂けると何ができるか分かりやすいと思います。2値分類ですので、こんなに「立っている」「見つめている」「ものを持っている」のような分類ではなく、「健常」「リスクあり」(+ほぼほぼ確定)のような2~3値分類の問題に差し替えられそうに思います。
33
+
34
+ ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-02-05/56262817-30cd-425c-a7bf-7b269b571e4c.png)
35
+ 出典:https://github.com/facebookresearch/SlowFast/raw/main/demo/ava_demo.gif
33
36
 
34
37
 
35
38
  元の投稿

7

 

2023/02/05 01:43

投稿

退会済みユーザー
test CHANGED
@@ -1,4 +1,19 @@
1
1
  2023-02-05追記
2
+ ---
3
+
4
+
5
+ 脳波の分析例
6
+ ---
7
+ [ライセンスの明記はありませんが「てんかん患者(?)脳波をGNN(グラフニューラルネットワーク)で捌いて評価した」](https://github.com/tsy935/eeg-gnn-ssl)というものもありますね。これの方が質問の意図に近そうに思います。「発作の検出云々」とあるので、**波形データをずっと見ていったときに、発作が起きた時に「発作だ!」と認識させるような使い方ができそう**に思います。
8
+
9
+ ――もう少し根気よく探せばライセンス的に問題ないものもあるかと思いますが、研究・開発用途(商売をしない)というのであればメールで「あなたのソースコードを使って発表をしたいが、クレジットに名前を載せさせてもらってもよいか」くらいの感じの対応をすれば彼らの論文の引用回数が増えますので悪い顔はされないだろうと思います。
10
+
11
+ ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-02-05/87d80d42-e7f1-4284-85ae-772ea03b7851.jpeg)
12
+ 出典:https://github.com/tsy935/eeg-gnn-ssl
13
+
14
+
15
+
16
+ 間接位置の推定からの分類の例
2
17
  ---
3
18
  10分くらいググると、一例として(今回の課題とは用途は違うかもしれませんが、データを差し替えれば手法自体は)[Action recognition](https://paperswithcode.com/task/action-recognition-in-videos)と呼ばれるタスクの解法が使えそうなことが分かります。ここで拾い上げたキーワードが**Action recognition**です。
4
19
  ※なぜAction recognitionという単語に行きついたかというと、時系列データを捌くLSTMというネットワーク構造と、姿勢認識で使われるMediapipeというライブラリを組み合わせてグーグル検索した結果、「Action recognition」という単語に行きついた具合です。
@@ -15,16 +30,6 @@
15
30
  たとえば、FacebookresearchがApacheライセンス2.0(要旨:商用OK、コード開示義務なし、ただしクレジットの表示は必要)で公開している[SlowFast](https://github.com/facebookresearch/SlowFast)はどうでしょうか?
16
31
 
17
32
  ファイルがでかくて画像をアップロードできませんでしたが、[同リポジトリのGIF画像](https://github.com/facebookresearch/SlowFast/raw/main/demo/ava_demo.gif)を見て頂けると何ができるか分かりやすいと思います。2値分類ですので、こんなに「立っている」「見つめている」「ものを持っている」のような分類ではなく、「健常」「リスクあり」(+ほぼほぼ確定)のような2~3値分類の問題に差し替えられそうに思います。
18
-
19
- 脳波の分析例
20
- ---
21
- [ライセンスの明記はありませんが「てんかん患者(?)脳波をGNN(グラフニューラルネットワーク)で捌いて評価した」](https://github.com/tsy935/eeg-gnn-ssl)というものもありますね。これの方が質問の意図に近そうに思います。「発作の検出云々」とあるので、**波形データをずっと見ていったときに、発作が起きた時に「発作だ!」と認識させるような使い方ができそう**に思います。
22
-
23
- ――もう少し根気よく探せばライセンス的に問題ないものもあるかと思いますが、研究・開発用途(商売をしない)というのであればメールで「あなたのソースコードを使って発表をしたいが、クレジットに名前を載せさせてもらってもよいか」くらいの感じの対応をすれば彼らの論文の引用回数が増えますので悪い顔はされないだろうと思います。
24
-
25
- ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-02-05/87d80d42-e7f1-4284-85ae-772ea03b7851.jpeg)
26
- 出典:https://github.com/tsy935/eeg-gnn-ssl
27
-
28
33
 
29
34
 
30
35
  元の投稿

6

 

2023/02/05 01:42

投稿

退会済みユーザー
test CHANGED
@@ -22,6 +22,8 @@
22
22
 
23
23
  ――もう少し根気よく探せばライセンス的に問題ないものもあるかと思いますが、研究・開発用途(商売をしない)というのであればメールで「あなたのソースコードを使って発表をしたいが、クレジットに名前を載せさせてもらってもよいか」くらいの感じの対応をすれば彼らの論文の引用回数が増えますので悪い顔はされないだろうと思います。
24
24
 
25
+ ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-02-05/87d80d42-e7f1-4284-85ae-772ea03b7851.jpeg)
26
+ 出典:https://github.com/tsy935/eeg-gnn-ssl
25
27
 
26
28
 
27
29
 

5

 

2023/02/05 01:41

投稿

退会済みユーザー
test CHANGED
@@ -16,8 +16,13 @@
16
16
 
17
17
  ファイルがでかくて画像をアップロードできませんでしたが、[同リポジトリのGIF画像](https://github.com/facebookresearch/SlowFast/raw/main/demo/ava_demo.gif)を見て頂けると何ができるか分かりやすいと思います。2値分類ですので、こんなに「立っている」「見つめている」「ものを持っている」のような分類ではなく、「健常」「リスクあり」(+ほぼほぼ確定)のような2~3値分類の問題に差し替えられそうに思います。
18
18
 
19
- [ライセンスの明記はありませんが「てんかん患者(?)脳波をGNN(グラフニューラルネットワーク)で捌いて評価した」](https://github.com/tsy935/eeg-gnn-ssl)というももありますね。これの方が質問の意図に近そうに思います。「発作の検出云々」とあるので、波形データをずっと見ていったときに、発作が起きた時に「発作だ!」と認識させるような使い方ができそうに思います。
19
+ 脳波の分析例
20
+ ---
21
+ [ライセンスの明記はありませんが「てんかん患者(?)脳波をGNN(グラフニューラルネットワーク)で捌いて評価した」](https://github.com/tsy935/eeg-gnn-ssl)というものもありますね。これの方が質問の意図に近そうに思います。「発作の検出云々」とあるので、**波形データをずっと見ていったときに、発作が起きた時に「発作だ!」と認識させるような使い方ができそう**に思います。
22
+
20
23
  ――もう少し根気よく探せばライセンス的に問題ないものもあるかと思いますが、研究・開発用途(商売をしない)というのであればメールで「あなたのソースコードを使って発表をしたいが、クレジットに名前を載せさせてもらってもよいか」くらいの感じの対応をすれば彼らの論文の引用回数が増えますので悪い顔はされないだろうと思います。
24
+
25
+
21
26
 
22
27
 
23
28
  元の投稿

4

追記2

2023/02/05 01:39

投稿

退会済みユーザー
test CHANGED
@@ -1,4 +1,3 @@
1
-
2
1
  2023-02-05追記
3
2
  ---
4
3
  10分くらいググると、一例として(今回の課題とは用途は違うかもしれませんが、データを差し替えれば手法自体は)[Action recognition](https://paperswithcode.com/task/action-recognition-in-videos)と呼ばれるタスクの解法が使えそうなことが分かります。ここで拾い上げたキーワードが**Action recognition**です。
@@ -16,6 +15,10 @@
16
15
  たとえば、FacebookresearchがApacheライセンス2.0(要旨:商用OK、コード開示義務なし、ただしクレジットの表示は必要)で公開している[SlowFast](https://github.com/facebookresearch/SlowFast)はどうでしょうか?
17
16
 
18
17
  ファイルがでかくて画像をアップロードできませんでしたが、[同リポジトリのGIF画像](https://github.com/facebookresearch/SlowFast/raw/main/demo/ava_demo.gif)を見て頂けると何ができるか分かりやすいと思います。2値分類ですので、こんなに「立っている」「見つめている」「ものを持っている」のような分類ではなく、「健常」「リスクあり」(+ほぼほぼ確定)のような2~3値分類の問題に差し替えられそうに思います。
18
+
19
+ [ライセンスの明記はありませんが「てんかん患者(?)脳波をGNN(グラフニューラルネットワーク)で捌いて評価した」](https://github.com/tsy935/eeg-gnn-ssl)というものもありますね。これの方が質問の意図に近そうに思います。「発作の検出云々」とあるので、波形データをずっと見ていったときに、発作が起きた時に「発作だ!」と認識させるような使い方ができそうに思います。
20
+ ――もう少し根気よく探せばライセンス的に問題ないものもあるかと思いますが、研究・開発用途(商売をしない)というのであればメールで「あなたのソースコードを使って発表をしたいが、クレジットに名前を載せさせてもらってもよいか」くらいの感じの対応をすれば彼らの論文の引用回数が増えますので悪い顔はされないだろうと思います。
21
+
19
22
 
20
23
  元の投稿
21
24
  ---

3

手法追記

2023/02/05 01:26

投稿

退会済みユーザー
test CHANGED
@@ -1,3 +1,26 @@
1
+
2
+ 2023-02-05追記
3
+ ---
4
+ 10分くらいググると、一例として(今回の課題とは用途は違うかもしれませんが、データを差し替えれば手法自体は)[Action recognition](https://paperswithcode.com/task/action-recognition-in-videos)と呼ばれるタスクの解法が使えそうなことが分かります。ここで拾い上げたキーワードが**Action recognition**です。
5
+ ※なぜAction recognitionという単語に行きついたかというと、時系列データを捌くLSTMというネットワーク構造と、姿勢認識で使われるMediapipeというライブラリを組み合わせてグーグル検索した結果、「Action recognition」という単語に行きついた具合です。
6
+
7
+ なので、
8
+ - "Action recognition" site:github.comと[グーグル検索してみる](https://www.google.com/search?q=%22Action+recognition%22+site%3Agithub.com)
9
+
10
+ - "Action recognition" site:paperswithcode.comと[グーグル検索してみる](https://www.google.com/search?q=site%3Apaperswithcode.com+action+recognition)
11
+ といろいろ出てきます。
12
+
13
+ ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-02-05/08572364-b464-411d-98d1-1f085b41e50d.png)
14
+ 出典:https://paperswithcode.com/sota/action-recognition-in-videos-on-something
15
+
16
+ たとえば、FacebookresearchがApacheライセンス2.0(要旨:商用OK、コード開示義務なし、ただしクレジットの表示は必要)で公開している[SlowFast](https://github.com/facebookresearch/SlowFast)はどうでしょうか?
17
+
18
+ ファイルがでかくて画像をアップロードできませんでしたが、[同リポジトリのGIF画像](https://github.com/facebookresearch/SlowFast/raw/main/demo/ava_demo.gif)を見て頂けると何ができるか分かりやすいと思います。2値分類ですので、こんなに「立っている」「見つめている」「ものを持っている」のような分類ではなく、「健常」「リスクあり」(+ほぼほぼ確定)のような2~3値分類の問題に差し替えられそうに思います。
19
+
20
+ 元の投稿
21
+ ---
22
+
23
+
1
24
  今回の課題のデータについて、イメージできるような説明(合ってますか?)
2
25
  ---
3
26
  例えばですが、PythonのライブラリでいうOpenPoseやMediapipeのような、1フレームにおける人毎について全身の関節ごとの画像上のXY座標and/or実際のXYZメートル座標のようなものが各列に収まっているデータを想定しました(細かいことはさておき、です)。
@@ -25,3 +48,6 @@
25
48
  出典:https://paperswithcode.com/sota/human-object-interaction-detection-on-v-coco
26
49
 
27
50
  タイトルくらいしか見ておりませんが、恐らく私が先に挙げたTransomerやGNNをベースにした手法が並んでいることだろうと思います。あと何年この状況が続くかは分かりませんが、恐らく斬新な手法が現れるまで、これらがあと数年はその斬新な手法を独占し続けるものと思います。
51
+
52
+
53
+

2

 

2023/02/02 04:17

投稿

退会済みユーザー
test CHANGED
@@ -16,7 +16,7 @@
16
16
  仮に関節の位置を使った動作推定(立っている、歩いている等)であれば、こういう関節群から何をしているか推定するのが得意な手法は、一般的にはTransformerやGNN(Graph Neural Network)だろうと思います。
17
17
 
18
18
  という感じでキーワード検索をすると…:
19
- 大体こういった「世界中のみんなが課題として抱えているリストにあるあるな感じの手法は、論文で既に公開されていて、しかも運が良ければ実際に動かせるコードも公開されていて、さらに運が良いと非GPLなライセンスで公開されています。あとは、どれがいいかなとえり好みするだけです。
19
+ 大体こういった「世界中のみんなが課題として抱えているリストにあるあるな感じの課題」を解決するための手法は、論文で既に公開されていて、しかも運が良ければ実際に動かせるコードも公開されていて、さらに運が良いと非GPLなライセンスで公開されています。あとは、どれがいいかなとえり好みするだけです。
20
20
 
21
21
  これができるサイトは[paperswithcode.com](https://paperswithcode.com/sota/human-object-interaction-detection-on-v-coco)です。URLの例では、MicrosoftのCOCOデータセットという巨大な画像データセットに含まれている人の動作を認識させよう、というもののようです。こんな感じで探っていくと沢山手法がヒットしますので、好みのものを使えばよろしいかと思います。
22
22
 

1

 

2023/02/02 04:16

投稿

退会済みユーザー
test CHANGED
@@ -16,7 +16,7 @@
16
16
  仮に関節の位置を使った動作推定(立っている、歩いている等)であれば、こういう関節群から何をしているか推定するのが得意な手法は、一般的にはTransformerやGNN(Graph Neural Network)だろうと思います。
17
17
 
18
18
  という感じでキーワード検索をすると…:
19
- 大体こういった「あるある」な感じの手法は、論文で既に公開されていて、しかも運が良ければ実際に動かせるコードも公開されていて、さらに運が良いと非GPLなライセンスで公開されています。あとは、どれがいいかなとえり好みするだけです。
19
+ 大体こういった「世界中のみんなが課題として抱えているリストにあるある」な感じの手法は、論文で既に公開されていて、しかも運が良ければ実際に動かせるコードも公開されていて、さらに運が良いと非GPLなライセンスで公開されています。あとは、どれがいいかなとえり好みするだけです。
20
20
 
21
21
  これができるサイトは[paperswithcode.com](https://paperswithcode.com/sota/human-object-interaction-detection-on-v-coco)です。URLの例では、MicrosoftのCOCOデータセットという巨大な画像データセットに含まれている人の動作を認識させよう、というもののようです。こんな感じで探っていくと沢山手法がヒットしますので、好みのものを使えばよろしいかと思います。
22
22