統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

RSS

  • 解決済

    回答
    2

    PythonのPandasを利用してPivot風にデータ集約するための前処理について

    前提・実現したいこと 300万行ほどの下記のようなデータがあり(CSV)、 その際、欠損値や型違いの値を削除もしくは別の値に置き換えています。 この処理速度を速くするために良い方法はないでしょうか? ◆CSVデータ(test.csv) item,earnings 商品A,123 商品B, 商品A,aaa 商品B,111 商品C,商

    • 0評価
    • 70PV
    k7_pgms88 k7_pgms88 1週間前
  • 受付中

    回答
    1

    最適値の算出の仕方

    花屋の通信販売においてコンビニに配送し受け取りができるサービスをはじめ、過去の注文時にて受け取りに使用したことのあるコンビニを注文画面で表示するようにしています。 対象の店舗の閉店している可能性を考慮して、データの抽出の際にある一定期間(ex 過去3ヶ月以内に受け取りに使用した店舗のみを表示等)を設けようと間考えております。 この『ある一定期間』の最適値

    • 0評価
    • 64PV
    pinchhachance pinchhachance 2週間前
  • 受付中

    回答
    4

    2枚の画像の濃淡具合を比較する方法

    二枚の画像を用意し、その画像の濃淡の度合いについて、各画素単位で比較を行いたいと考えています。 例えば、画素値が 1,2,3,4 となる画像と 3,4,5,6 からなる画像があったとして、 それぞれ左から順番に対応していたとします。 このとき、値自体は全て違いますが、濃淡の分布における、対応点同士の比較では等しい濃淡の分布だと評価したいです。

    • 0評価
    • 151PV
    horumonitame horumonitame 2ヶ月前
  • 解決済

    回答
    2

    グループ分け方法が思いつかず困っています

    出力されたデータに対してアプローチ手法を思いつかず困っています。 100個のラベル付されたデータが存在します。 100個のデータについて似通ったものでいくつかのグループに振り分けたいと考えています。 そこで100個のデータ間の類似度(0以上の浮動小数点)を算出しました。 このデータを次にどう処理すればいいのかわからず困っています。 ここまで

    • 0評価
    • 88PV
    namuyan_mine namuyan_mine 2ヶ月前
  • 受付中

    回答
    0

    R言語のdocMatrixの品詞の細分類について

    R言語を用いて文章集合に対してTF-IDFを算出する際に res = docMatrix("txt", pos=c("名詞", "形容詞"), weight="tf*idf*norm") と記述するのですが 名詞や形容詞の中でも、非自立語や数を取り除きたいときはどのようにすれば良いのでしょうか? よろしくお願いいたします。

    • 0評価
    • 89PV
    jimmypage0311 jimmypage0311 2ヶ月前
  • 受付中

    回答
    1

    適合率と再現率

    バグの有無の予測の実験してるんですが、適合率と再現率の求め方がわかりません。 予測結果が0.4453とか0.3455とか出たのですがこれらを公式に当てはめればいいのですか? 修正 バグの有無予測のため、Rでロジスティック回帰と線形判別分析で予測しました。 しかしバグが有るか無いかはどうやって調べるのですか? 目的変数0と1にしたんですが、予測結

    • 0評価
    • 126PV
    edene edene 3ヶ月前
  • 受付中

    回答
    0

    エクセルのTINV関数をPHPで実装したい

    前提・実現したいこと http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/tdistinvtab.html にあるようなt分布表の数値を計算式により導き出したいのです。 PHPにはstatsといったPECLの統計関数拡張モジュールもあるようなのですが、未ドキュメント化状態なのと環境により使えない場合もある

    • 0評価
    • 133PV
    kensii kensii 3ヶ月前
  • 受付中

    回答
    0

    Rで線形判別分析での予測

    線形判別分析で予測したいのですが、 Error in lda.default(x, grouping, ...) : variable 2 appears to be constant within groups というエラーが出ます。これはどういうエラーですか? 以下がソースコードです library(MASS) fit.lda <-

    • 0評価
    • 158PV
    cde cde 3ヶ月前
  • 受付中

    回答
    0

    Rでバグ予測をするのですがデータ選定で困っています。

    Tomcatのデータを使いバグの有無の予測をするのですがTomcatのデータ選定でつまづいております。 メトリクスwmcやditやnocなどあり、数字がいっぱい並んでおりどれを消せばいいのかわかりません。教えてください。 予測手法はロジスティック回帰と線形判別分析を使います。 tomcatのデータは以下でダウンロードできます https://te

    • 0評価
    • 178PV
    edene edene 3ヶ月前
  • 受付中

    回答
    1

    ロジスティック回帰分析

    Rにてロジスティック回帰分析で予測したいのですが以下のコードを実行すると fit=glm(bug~.,family = binomial,data=fit.df,) Error in eval(expr, envir, enclos) : y values must be 0 <= y <= 1 というエラーが出ます。なぜでしょうか? fit.g

    • 0評価
    • 182PV
    cde cde 3ヶ月前
  • 受付中

    回答
    0

    交差検証

    CROSS validationのやり方よくわかりません。データを10個に分割するとこまではできました。 そこからRで予測したいのですがどうやるのですか?また予測した結果はどこに表示されますか?

    • 0評価
    • 201PV
    cde cde 3ヶ月前
  • 受付中

    回答
    0

    「Rによるやさしい統計学」の17章共分散構造分析についての質問

    山田剛史など「Rによるやさしい統計学」についての質問です 17章の共分散構造分析の17.2.2「測定方程式と構造方程式の記述」で表記されてるコードをRstudioを用いて実行してもエラーが発し実行されません library(sem)なども実行を行っています。なぜでしょうか? もし、分かる方がいらっしゃれば教えていただけますでしょうか。 これは出来たら

    • 0評価
    • 151PV
    hkefka_moxon hkefka_moxon 3ヶ月前
  • 受付中

    回答
    0

    バグ予測に関する研究

    バグ予測に関する研究で、Tomcatというデータを使いロジスティック回帰と線形判別分析の2つの手法でバグの有無を予測するのですが,Rstudioで実行するのですが以下のプログラムを書き換えればできますか? tomcatのデータは以下からDLできます。https://terapromise.csc.ncsu.edu/!/#repo/view/head/def

    • -2評価
    • 221PV
    cde cde 4ヶ月前
  • 受付中

    回答
    0

    R言語

    R言語ですが以下のプログラムの意味が全く理解できません。教えてください また、ロジスティック回帰と線形判別分析で実行したいんですが以下のプログラム改良すればできますか? m_max<-9#最初に来る数字の最大値 k_max<-0#次に来る数字の最大値 dname<-"C:/Users/" #install.packages('randomForest

    • -1評価
    • 191PV
    cde cde 4ヶ月前
  • 受付中

    回答
    1

    Rでロジスティック回帰と線形判別分析の実行

    Rstudioで以下のプログラムを実行するとエラーが出ます。どこか修正点があればご指摘お願いします。 以下のようなエラーです。 Error in xy.coords(x, y, xlabel, ylabel, log) : 'x' is a list, but does not have components 'x' and 'y' m_ma

    • 0評価
    • 210PV
    cde cde 4ヶ月前
  • 受付中

    回答
    0

    Rで一般化モーメント法(GMM)

    Rで一般化モーメント法を行おうとしています。 しかし、統計の知識が乏しく、ドキュメントを読んでも、いまいち分かりません。 私はこの論文の6ページ、(3)と(4)と似たようなことをしようとしています。 Rで(3)と(4)式の推定を行うためにはどのようなスクリプトを書けば良いのでしょうか? 合わせてどのようなデータセットを用意

    • -1評価
    • 165PV
    sh.t.jax sh.t.jax 4ヶ月前
  • 受付中

    回答
    0

    ダミー変数を正規化することのメリットを教えてください

    回帰分析において、説明変数に1、0のダミー変数を使った分析を行うことがありますが、その際に、説明変数に用いるダミー変数を正規化することのメリットをご教示ねがえませんでしょうか

    • 0評価
    • 296PV
    hermitagejp hermitagejp 9ヶ月前
  • 解決済

    回答
    1

    Apache Spark MLlib (Scala) による主成分分析

    Apache Spark MLlib (Scala)に関して質問させて下さい。 質問 Spark MLlibで主成分分析をしたいのですが、RDD[(String, String, Double)]をRowMatrixに変換するにはどうすれば良いでしょうか? 下記の、データ変換のイメージをご参照いただき、そもそもやりたいことに対して、アプローチが

    • 1評価
    • 443PV
    Masaaki_Inaba Masaaki_Inaba 10ヶ月前
  • 解決済

    回答
    1

    pythonのpandsで各セルの正規化

    以下のようなDFの各数値を正規化(平均0,分散1)したい場合、 通常は (x-mean)/std で正規化すると思うのですが、mean(),std()を各列で算出しfor文を使ってちまちま計算するしかないのでしょうか? 各セルに対し、それぞれのmeanやstdを使って計算を行いたい場合の良い方法はありますでしょうか? df

    • 0評価
    • 1327PV
    KeitoKojima KeitoKojima 11ヶ月前
  • 解決済

    回答
    3

    PHP 標準偏差が正しく計算できない

    こんにちは。 PHPで標準偏差を計算しようとしているのですが、うまくいきません。 function r($num) { return round($num, 2); } function h($arr) { return r(array_sum($arr) / count($arr)); } function v($values) {

    • 0評価
    • 371PV
    hika_pon hika_pon 11ヶ月前
1

タグ情報

  • あなたの順位

    -

  • タグ登録者数

    52

  • 総質問数

    34

  • 今週の質問数

    0

関連するタグ

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る