統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

RSS

  • 受付中

    回答
    1

    x-meansのBICの計算方法がわからない

    この論文を読んでx-means法を再現しようとしています。x-means法のアルゴリズムは何となく理解は出来ましたが、途中で出てくるBICとBIC'の計算がよく理解できません。 BICはCiに含まれるデータ1つ1つのp変量正規分布を計算し、すべてを掛け合わせればBICが計算できると自分なりに解釈しているのですが... BIC'の計算は、始めから何をや

    • -2評価
    • 70PV
    rkhs rkhs 1ヶ月前に 回答
  • 受付中

    回答
    2

    事前確率という概念について

    事前確率という概念とその周辺のことが良く分かりません。 事後確率は条件付確率のことだというのはなんとなくわかるのですが、事後確率P(A|B)に対して事前確率P(A)なのであれば事前確率というのは周辺確率に対応する概念なのでしょうか?Wikipediaを見ると「事前確率に尤度関数の出力値を掛けると事後確率が得られる」とありますが、こちらのページには尤度は確率と

    • 0評価
    • 773PV
    doratai doratai 3ヶ月前に 回答
  • 受付中

    回答
    8

    javaとc++、どちらが統計解析、機械学習、データマイニングに向いていますか?

    オブジェクト指向言語を本格的に勉強しようと思うのですが、できれば機械学習や統計解析、データマイニングに応用できればと思っております。 どちらのほうが適当でしょうか? 機械学習、統計解析、データマイニングでやることは違ってくるとは思うのですが、回答よろしくお願いします。 一応C言語の基礎とjavaで簡単なGUIの作製ができるくらいは勉強しました。

    • 0評価
    • 4415PV
    elda elda 4ヶ月前に 回答
  • 解決済

    回答
    3

    統計学的に平均値のMax、Minを出す必要性はある?

    開発中のシステムで日毎の成約率を集計しているのですが、ある月の最も高い成約率と最も低い成約率を出す意味というのはありますか? 例えば、5月5日に100アクセスで10件成約し成約率が10%であったとして、5月10日には2アクセスで1件成約し成約率が50%であった場合、5月10日の成約率が極端に高くなってしまうので、平均値のMAX、MINを出す意味って統計

    • 0評価
    • 392PV
    King_of_Flies King_of_Flies 7ヶ月前に ベストアンサー
  • 解決済

    回答
    2

    PythonのPandasを利用してPivot風にデータ集約するための前処理について

    前提・実現したいこと 300万行ほどの下記のようなデータがあり(CSV)、 その際、欠損値や型違いの値を削除もしくは別の値に置き換えています。 この処理速度を速くするために良い方法はないでしょうか? ◆CSVデータ(test.csv) item,earnings 商品A,123 商品B, 商品A,aaa 商品B,111 商品C,商

    • 0評価
    • 447PV
    tell_k tell_k 9ヶ月前に コメント
  • 受付中

    回答
    1

    最適値の算出の仕方

    花屋の通信販売においてコンビニに配送し受け取りができるサービスをはじめ、過去の注文時にて受け取りに使用したことのあるコンビニを注文画面で表示するようにしています。 対象の店舗の閉店している可能性を考慮して、データの抽出の際にある一定期間(ex 過去3ヶ月以内に受け取りに使用した店舗のみを表示等)を設けようと間考えております。 この『ある一定期間』の最適値

    • 0評価
    • 229PV
    tacsheaven tacsheaven 9ヶ月前に 回答を編集
  • 解決済

    回答
    2

    グループ分け方法が思いつかず困っています

    出力されたデータに対してアプローチ手法を思いつかず困っています。 100個のラベル付されたデータが存在します。 100個のデータについて似通ったものでいくつかのグループに振り分けたいと考えています。 そこで100個のデータ間の類似度(0以上の浮動小数点)を算出しました。 このデータを次にどう処理すればいいのかわからず困っています。 ここまで

    • 0評価
    • 321PV
    Victorian-Vat Victorian-Vat 10ヶ月前に ベストアンサー
  • 受付中

    回答
    4

    2枚の画像の濃淡具合を比較する方法

    二枚の画像を用意し、その画像の濃淡の度合いについて、各画素単位で比較を行いたいと考えています。 例えば、画素値が 1,2,3,4 となる画像と 3,4,5,6 からなる画像があったとして、 それぞれ左から順番に対応していたとします。 このとき、値自体は全て違いますが、濃淡の分布における、対応点同士の比較では等しい濃淡の分布だと評価したいです。

    • 0評価
    • 375PV
    WoodenHamlet WoodenHamlet 10ヶ月前に コメント
  • 受付中

    回答
    0

    R言語のdocMatrixの品詞の細分類について

    R言語を用いて文章集合に対してTF-IDFを算出する際に res = docMatrix("txt", pos=c("名詞", "形容詞"), weight="tf*idf*norm") と記述するのですが 名詞や形容詞の中でも、非自立語や数を取り除きたいときはどのようにすれば良いのでしょうか? よろしくお願いいたします。

    • 0評価
    • 371PV
    teratailが10ヶ月前に アップデート
  • 受付中

    回答
    0

    エクセルのTINV関数をPHPで実装したい

    前提・実現したいこと http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/tdistinvtab.html にあるようなt分布表の数値を計算式により導き出したいのです。 PHPにはstatsといったPECLの統計関数拡張モジュールもあるようなのですが、未ドキュメント化状態なのと環境により使えない場合もある

    • 0評価
    • 365PV
    kensii kensii 11ヶ月前に 質問を編集
  • 受付中

    回答
    1

    適合率と再現率

    バグの有無の予測の実験してるんですが、適合率と再現率の求め方がわかりません。 予測結果が0.4453とか0.3455とか出たのですがこれらを公式に当てはめればいいのですか? 修正 バグの有無予測のため、Rでロジスティック回帰と線形判別分析で予測しました。 しかしバグが有るか無いかはどうやって調べるのですか? 目的変数0と1にしたんですが、予測結

    • 0評価
    • 458PV
    rkhs rkhs 11ヶ月前に 回答
  • 受付中

    回答
    1

    ロジスティック回帰分析

    Rにてロジスティック回帰分析で予測したいのですが以下のコードを実行すると fit=glm(bug~.,family = binomial,data=fit.df,) Error in eval(expr, envir, enclos) : y values must be 0 <= y <= 1 というエラーが出ます。なぜでしょうか? fit.g

    • 0評価
    • 584PV
    Victorian-Vat Victorian-Vat 1年以上前に コメント
  • 受付中

    回答
    0

    Rで線形判別分析での予測

    線形判別分析で予測したいのですが、 Error in lda.default(x, grouping, ...) : variable 2 appears to be constant within groups というエラーが出ます。これはどういうエラーですか? 以下がソースコードです library(MASS) fit.lda <-

    • 0評価
    • 410PV
    teratailが1年以上前に アップデート
  • 受付中

    回答
    0

    Rでバグ予測をするのですがデータ選定で困っています。

    Tomcatのデータを使いバグの有無の予測をするのですがTomcatのデータ選定でつまづいております。 メトリクスwmcやditやnocなどあり、数字がいっぱい並んでおりどれを消せばいいのかわかりません。教えてください。 予測手法はロジスティック回帰と線形判別分析を使います。 tomcatのデータは以下でダウンロードできます https://te

    • 0評価
    • 377PV
    teratailが1年以上前に アップデート
  • 受付中

    回答
    0

    交差検証

    CROSS validationのやり方よくわかりません。データを10個に分割するとこまではできました。 そこからRで予測したいのですがどうやるのですか?また予測した結果はどこに表示されますか?

    • 0評価
    • 603PV
    teratailが1年以上前に アップデート
  • 受付中

    回答
    0

    「Rによるやさしい統計学」の17章共分散構造分析についての質問

    山田剛史など「Rによるやさしい統計学」についての質問です 17章の共分散構造分析の17.2.2「測定方程式と構造方程式の記述」で表記されてるコードをRstudioを用いて実行してもエラーが発し実行されません library(sem)なども実行を行っています。なぜでしょうか? もし、分かる方がいらっしゃれば教えていただけますでしょうか。 これは出来たら

    • 0評価
    • 411PV
    teratailが1年以上前に アップデート
  • 受付中

    回答
    0

    バグ予測に関する研究

    バグ予測に関する研究で、Tomcatというデータを使いロジスティック回帰と線形判別分析の2つの手法でバグの有無を予測するのですが,Rstudioで実行するのですが以下のプログラムを書き換えればできますか? tomcatのデータは以下からDLできます。https://terapromise.csc.ncsu.edu/!/#repo/view/head/def

    • -2評価
    • 420PV
    cde cde 1年以上前に 質問を編集
  • 受付中

    回答
    0

    R言語

    R言語ですが以下のプログラムの意味が全く理解できません。教えてください また、ロジスティック回帰と線形判別分析で実行したいんですが以下のプログラム改良すればできますか? m_max<-9#最初に来る数字の最大値 k_max<-0#次に来る数字の最大値 dname<-"C:/Users/" #install.packages('randomForest

    • -1評価
    • 390PV
    teratailが1年以上前に アップデート
  • 受付中

    回答
    1

    Rでロジスティック回帰と線形判別分析の実行

    Rstudioで以下のプログラムを実行するとエラーが出ます。どこか修正点があればご指摘お願いします。 以下のようなエラーです。 Error in xy.coords(x, y, xlabel, ylabel, log) : 'x' is a list, but does not have components 'x' and 'y' m_ma

    • 0評価
    • 563PV
    nagaetty nagaetty 1年以上前に 回答
  • 受付中

    回答
    0

    Rで一般化モーメント法(GMM)

    Rで一般化モーメント法を行おうとしています。 しかし、統計の知識が乏しく、ドキュメントを読んでも、いまいち分かりません。 私はこの論文の6ページ、(3)と(4)と似たようなことをしようとしています。 Rで(3)と(4)式の推定を行うためにはどのようなスクリプトを書けば良いのでしょうか? 合わせてどのようなデータセットを用意

    • -1評価
    • 480PV
    sh.t.jax sh.t.jax 1年以上前に 質問を編集
1

タグ情報

  • あなたの順位

    -

  • タグ登録者数

    62

  • 総質問数

    34

  • 今週の質問数

    0

関連するタグ

統計タグのよく見られている質問

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る