質問するログイン新規登録

回答編集履歴

4

修正

2021/11/24 02:47

投稿

退会済みユーザー
answer CHANGED
@@ -7,24 +7,26 @@
7
7
  (引用者注:Aはサービス名)
8
8
 
9
9
  とのことですから、
10
- ・Youtubeをよく見ている一般視聴者を募集(無償か有償かは不明)
10
+ ・Youtubeをよく見ている一般視聴者を募集(無償か有償かは不明)
11
- ・その人の性別や年齢をあらかじめ生年月、趣味等をあらかじめ申告してもらい収集しておく
11
+ ・その人の性別や生年月等をあらかじめ申告してもらい収集しておく
12
+ ・その人たちの全視聴履歴を定期的に取得することができる
12
- ・その人たちの全視聴履歴を定期的に取得することができる何らかのアブリをインストールしてもらう等の手段を用いて、
13
+ 何らかのアブリをインストールしてもらう等の手段を用いて、
13
- 各人の視聴履歴を収集
14
+ 各人のYouTube視聴履歴を収集
14
15
 
15
16
  ・収集した視聴者の視聴履歴と年齢性別等の属性を絡めてデータ化して機械学習させる
17
+ (動画idさえわかれば、動画タイトルに設定されているキーワード、チャンネルの説明文、ユーザーコメントの内容あたりは誰でもAPIを使って取得できます。
18
+ キモは視聴者の属性と視聴した動画の紐付けてす)
16
19
 
17
20
  くらいのことでしょうか。
18
- よくあるマーケティングのブランド調査に流行りの機械学習絡めたという感じですね。
21
+ よくあるマーケティングのブランド調査みたいなものに流行りの機械学習絡めたという感じですね。
19
22
 
20
23
  > どこで正解データを手に入れたのか、そもそもそれが本当に合っているデータなのか)
21
24
 
22
25
  一部の視聴者がアンケートの段階で嘘を付いてる場合もあるでしょうし、
23
- そもそも機械学習による推測なので
24
- 厳密な正解データではありませんし、
26
+ そもそも機械学習による推測なので厳密な正解データではありませんし、
25
- 本当に合っているデータとは一概には言えないのではないでしょうか。
27
+ 本当に合っているデータとは一概には言えないのではないでしょうか。
26
28
 
27
- やり方によってはYouTubeの利用規約に抵触することもありうるので、
29
+ 情報収集のやり方によってはYouTubeの利用規約に抵触することもありえます。
28
- 抵触しないように、よりマイルドな方法をつかっていることもかんがえられます。
30
+ 抵触しないように、精度を落とすこととのトレードオフで、よりマイルドな方法をつかっていることもえられます。
29
31
 
30
- 精度についてはアルゴリズムや学習結果のデータが非公開であることもあり、なんともいえません
32
+ 精度についてはアルゴリズムや学習結果のデータが非公開であることもあり、なんともいえません

3

修正

2021/11/24 02:47

投稿

退会済みユーザー
answer CHANGED
@@ -7,9 +7,10 @@
7
7
  (引用者注:Aはサービス名)
8
8
 
9
9
  とのことですから、
10
- ・Youtubeをよく見ている一般視聴者者を募集
10
+ ・Youtubeをよく見ている一般視聴者者を募集(無償か有償かは不明)
11
- ・その人の性別や年齢をあらかじめ生年月、趣味等をあらかじめ収集しておく
11
+ ・その人の性別や年齢をあらかじめ生年月、趣味等をあらかじめ申告してもらい収集しておく
12
- ・その人たちの全視聴履歴を定期的に取得することができる何らかのアブリをインストールしてもらう等の手段を用いて、各人の視聴履歴を収集
12
+ ・その人たちの全視聴履歴を定期的に取得することができる何らかのアブリをインストールしてもらう等の手段を用いて、
13
+ 各人の視聴履歴を収集
13
14
 
14
15
  ・収集した視聴者の視聴履歴と年齢性別等の属性を絡めてデータ化して機械学習させる
15
16
 
@@ -23,4 +24,7 @@
23
24
  厳密な正解データではありませんし、
24
25
  本当に合っているデータとは一概には言えないのではないでしょうか。
25
26
 
27
+ やり方によってはYouTubeの利用規約に抵触することもありうるので、
28
+ 抵触しないように、よりマイルドな方法をつかっていることもかんがえられます。
29
+
26
30
  精度についてはアルゴリズムや学習結果のデータが非公開であることもあり、なんともいえません。

2

修整

2021/11/23 23:13

投稿

退会済みユーザー
answer CHANGED
@@ -1,6 +1,5 @@
1
1
  > どうにかして上記2つのデータを集めている方法を知りたく思います。
2
2
 
3
- サイトをきちんと読めばすぐわかることですが、
4
3
  引用すると
5
4
  > (A)には21,000件の登録者データが存在しています。そこから独自に蓄積したデータを、今回の男女比データの推測に利用しています。
6
5
  > これを、クリエイターのカテゴリごとに、動画タイトルのキーワード、チャンネルの説明文、ユーザーコメントの内容といったデータを軸に、機械学習によって、データ表示・抽出しています
@@ -24,6 +23,4 @@
24
23
  厳密な正解データではありませんし、
25
24
  本当に合っているデータとは一概には言えないのではないでしょうか。
26
25
 
27
- 精度についてはアルゴリズムや学習結果のデータが非公開であることもあり、なんともいえません。
26
+ 精度についてはアルゴリズムや学習結果のデータが非公開であることもあり、なんともいえません。
28
-
29
- 21000人のデータを集める方法ですが、500円のアマギフくらいで集めたのでしょうかね…

1

typo

2021/11/23 23:08

投稿

退会済みユーザー
answer CHANGED
@@ -26,4 +26,4 @@
26
26
 
27
27
  精度についてはアルゴリズムや学習結果のデータが非公開であることもあり、なんともいえません。
28
28
 
29
- 21000人のデータを集める方法ですが、500円のアマギフくらいですぐまるのではないでしょう
29
+ 21000人のデータを集める方法ですが、500円のアマギフくらいで集めたのでしょうかね…