以下のように無作為な情報を抽出したとします。
a{E,M,D,4,R}
b{3,9,S,5,R,6,P,2,M,B}
c{E,Q,4,Z}
このとき、
aの要素でbを探索するとマッチするのはMとRで、マッチ率 2/5
bの要素でaを探索するとマッチするのはMとRで、マッチ率 2/10
cの要素でaを探索するとマッチするのはEと4で、マッチ率 2/4
となり、「cの集合はaに対してマッチ度が高い」ということが言えそうです。
ある意味それで正しいと思うのですが、「探索先の要素数が多いほどマッチ率が上がりやすい」ということを考慮した上でのマッチ率を出せないかと思っています。
つまり、a,b,cの要素はランダムに選んでいて異なるのは要素数のみなので、抜き出す要素数が同じであれば本質的なマッチ率には差がないはずです。
この場合、a,bからさらに無作為に4文字を抽出する以外に、全ての要素数を保ったまま本質的なマッチ率を出すような標準化はできるのでしょうか?
統計学でいう、標準誤差のようなものをマッチ率に適用したいイメージです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/05/18 12:49