統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

RSS
  • 解決済

    回答
    1

    Scikit learn の mean_square_error について

    scikit learn の mean_square_error について理解があまりなっていないので質問します 僕が勘違いしているだけだと思うのでご指摘お願いします 例えば多項式回帰についてデータを分割した後に, poly_reg = PolynomialFeatures(degree=2) poly_x = poly_reg.fit_transf

    • 0評価
    • 61PV
    gogotea gogotea 2週間前に ベストアンサー
  • 受付中

    回答
    0

    ACCESSでの幾何平均の求め方

    季節商品など、時期によってばらつきのある商品の幾何平均をACCESSで求めたいのですが、どのような方法があるでしょうか? ExcelでGEOMEAN関数を使用して作成したファイルをインポートするしか方法はないのでしょうか? よろしくお願いいたします。

    • 0評価
    • 39PV
    teratailが1ヶ月前に アップデート
  • 受付中

    回答
    1

    ある分布でサンプリングと出力とは?

    機械学習分野には 『XX分布でサンプリングする』とか『NNの出力をXX分布にする=XX分布であるようNNの出力をさせる?』という表現ありますが。 理解できません。 「サンプル(そのもの)がXX分布になっている」のような表現は分かりますが、 人間の意志によってわざわざ『特定の分布』でサンプリングするのはどうやって実現するのでしょうか。 同様に、どうやっ

    • 0評価
    • 128PV
    oookabe oookabe 1ヶ月前に コメント
  • 受付中

    回答
    1

    conditional variational autoencoder (CVAE) のM1+M2に...

    conditional variational autoencoder (CVAE) についてです。 現在、M1+M2(参考:Semi-supervised Learning with Deep Generative Models)の実装をしようとしているのですが、国内外のさまざまなブログ、pdfなどを見ても、どれもモデルがバラバラであるため、全体の概要

    • 0評価
    • 74PV
    tanshoko tanshoko 1ヶ月前に コメント
  • 解決済

    回答
    1

    seaborn.facetgridでの文字追加

    seabornのfacetgridで複数のグラフを作成するときに、 グラフに文字を書き込むこむ方法を教えて欲しいです。 具体的には、複数のヒストグラムをあるパラメーターで層別して表示したいのですが、 それぞれのヒストグラムのAveとSigmaの数字も表示させたいです。 (AveとSigmaは事前に計算するとして) 以下はseabornのfacetgrid

    • 0評価
    • 114PV
    satopooooon satopooooon 1ヶ月前に コメント
  • 解決済

    回答
    1

    間隔データの間隔の推定方法

    間隔データにおける、間隔の推定方法について質問させてください。 前提として 例えば、下記のxのようなある一定間隔で1があるデータがあるとします。 例:4つおきに1があるデータ x =[1,0,0,0,0,1,0,0,0,0,1,0,0,0,0,1,0,0,0,0,1,0,0,0,0] こちらについて、最初の1から、次の1までの0の

    • 0評価
    • 126PV
    KK-31 KK-31 2ヶ月前に コメント
  • 解決済

    回答
    2

    Jupyter notebookのエラー:NameError: name 'get_ipython'...

    import ipystata これで下記のエラーが出ます。 NameError: name 'get_ipython' is not defined どんなことが原因と考えられるでしょうか? お教え頂けたらと思います。 補足 最終的にやりたいことは 「jupyter notebookからStataを使いたい」です。 https://github.

    • 0評価
    • 165PV
    nono33 nono33 2ヶ月前に 回答
  • 解決済

    回答
    1

    chainerを用いたNNモデルのfwd内におけるエラーが解決できません。

    現在、chainerを用いる練習として以下のようなモデルを組んでいます。 class MyChain(Chain): def __init__(self): super(MyChain, self).__init__( l1 = L.Linear(361,64), b1 = L.Ba

    • 0評価
    • 118PV
    futashige futashige 2ヶ月前に 回答
  • 解決済

    回答
    1

    NNを用いる際の勾配爆発について

    現在,chainerを用いてニューラルネットのモデルを組んでいます. 初めに,正則化を加えていないと以下のようなエラーが出ました. /.pyenv/versions/anaconda3-4.3.0/lib/python3.6/site-packages/chainer/functions/activation/relu.py:73: RuntimeWar

    • 0評価
    • 216PV
    futashige futashige 3ヶ月前に コメント
  • 解決済

    回答
    1

    R言語がこれからPythonに取って代わられてしまうのでしょうか?

    R言語でできることが、Pythonでも出来るという話を聴いて、実際はそんなことあるのだろうかと疑問に感じています。R言語はpythonに取って代わられてしまうのでしょうか?

    • 0評価
    • 241PV
    gumimomoko gumimomoko 4ヶ月前に コメント
  • 受付中

    回答
    1

    x-meansのBICの計算方法がわからない

    この論文を読んでx-means法を再現しようとしています。x-means法のアルゴリズムは何となく理解は出来ましたが、途中で出てくるBICとBIC'の計算がよく理解できません。 BICはCiに含まれるデータ1つ1つのp変量正規分布を計算し、すべてを掛け合わせればBICが計算できると自分なりに解釈しているのですが... BIC'の計算は、始めから何をや

    • -2評価
    • 285PV
    rkhs rkhs 6ヶ月前に 回答
  • 受付中

    回答
    2

    事前確率という概念について

    事前確率という概念とその周辺のことが良く分かりません。 事後確率は条件付確率のことだというのはなんとなくわかるのですが、事後確率P(A|B)に対して事前確率P(A)なのであれば事前確率というのは周辺確率に対応する概念なのでしょうか?Wikipediaを見ると「事前確率に尤度関数の出力値を掛けると事後確率が得られる」とありますが、こちらのページには尤度は確率と

    • 0評価
    • 861PV
    doratai doratai 8ヶ月前に 回答
  • 受付中

    回答
    8

    javaとc++、どちらが統計解析、機械学習、データマイニングに向いていますか?

    オブジェクト指向言語を本格的に勉強しようと思うのですが、できれば機械学習や統計解析、データマイニングに応用できればと思っております。 どちらのほうが適当でしょうか? 機械学習、統計解析、データマイニングでやることは違ってくるとは思うのですが、回答よろしくお願いします。 一応C言語の基礎とjavaで簡単なGUIの作製ができるくらいは勉強しました。

    • 0評価
    • 5048PV
    elda elda 9ヶ月前に 回答
  • 解決済

    回答
    3

    統計学的に平均値のMax、Minを出す必要性はある?

    開発中のシステムで日毎の成約率を集計しているのですが、ある月の最も高い成約率と最も低い成約率を出す意味というのはありますか? 例えば、5月5日に100アクセスで10件成約し成約率が10%であったとして、5月10日には2アクセスで1件成約し成約率が50%であった場合、5月10日の成約率が極端に高くなってしまうので、平均値のMAX、MINを出す意味って統計

    • 0評価
    • 485PV
    King_of_Flies King_of_Flies 1年以上前に ベストアンサー
  • 解決済

    回答
    2

    PythonのPandasを利用してPivot風にデータ集約するための前処理について

    前提・実現したいこと 300万行ほどの下記のようなデータがあり(CSV)、 その際、欠損値や型違いの値を削除もしくは別の値に置き換えています。 この処理速度を速くするために良い方法はないでしょうか? ◆CSVデータ(test.csv) item,earnings 商品A,123 商品B, 商品A,aaa 商品B,111 商品C,商

    • 0評価
    • 783PV
    tell_k tell_k 1年以上前に コメント
  • 受付中

    回答
    1

    最適値の算出の仕方

    花屋の通信販売においてコンビニに配送し受け取りができるサービスをはじめ、過去の注文時にて受け取りに使用したことのあるコンビニを注文画面で表示するようにしています。 対象の店舗の閉店している可能性を考慮して、データの抽出の際にある一定期間(ex 過去3ヶ月以内に受け取りに使用した店舗のみを表示等)を設けようと間考えております。 この『ある一定期間』の最適値

    • 0評価
    • 313PV
    tacsheaven tacsheaven 1年以上前に 回答を編集
  • 受付中

    回答
    4

    2枚の画像の濃淡具合を比較する方法

    二枚の画像を用意し、その画像の濃淡の度合いについて、各画素単位で比較を行いたいと考えています。 例えば、画素値が 1,2,3,4 となる画像と 3,4,5,6 からなる画像があったとして、 それぞれ左から順番に対応していたとします。 このとき、値自体は全て違いますが、濃淡の分布における、対応点同士の比較では等しい濃淡の分布だと評価したいです。

    • 0評価
    • 507PV
    WoodenHamlet WoodenHamlet 1年以上前に コメント
  • 解決済

    回答
    2

    グループ分け方法が思いつかず困っています

    出力されたデータに対してアプローチ手法を思いつかず困っています。 100個のラベル付されたデータが存在します。 100個のデータについて似通ったものでいくつかのグループに振り分けたいと考えています。 そこで100個のデータ間の類似度(0以上の浮動小数点)を算出しました。 このデータを次にどう処理すればいいのかわからず困っています。 ここまで

    • 0評価
    • 489PV
    Victorian-Vat Victorian-Vat 1年以上前に ベストアンサー
  • 受付中

    回答
    0

    R言語のdocMatrixの品詞の細分類について

    R言語を用いて文章集合に対してTF-IDFを算出する際に res = docMatrix("txt", pos=c("名詞", "形容詞"), weight="tf*idf*norm") と記述するのですが 名詞や形容詞の中でも、非自立語や数を取り除きたいときはどのようにすれば良いのでしょうか? よろしくお願いいたします。

    • 0評価
    • 537PV
    teratailが1年以上前に アップデート
  • 受付中

    回答
    0

    エクセルのTINV関数をPHPで実装したい

    前提・実現したいこと http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/tdistinvtab.html にあるようなt分布表の数値を計算式により導き出したいのです。 PHPにはstatsといったPECLの統計関数拡張モジュールもあるようなのですが、未ドキュメント化状態なのと環境により使えない場合もある

    • 0評価
    • 472PV
    kensii kensii 1年以上前に 質問を編集
1

タグ情報

  • あなたの順位

    -

  • タグ登録者数

    76

  • 総質問数

    44

  • 今週の質問数

    0

関連するタグ

統計タグのよく見られている質問

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る