データマイニング

データマイニングは、購買履歴やクレジットカードの利用履歴、電話の通話履歴など企業にある大量のデータを解析して、その中に隠れたパターンやルールを探し出す技術です。DMと略されることもあります。

RSS

  • 受付中

    回答
    8

    javaとc++、どちらが統計解析、機械学習、データマイニングに向いていますか?

    オブジェクト指向言語を本格的に勉強しようと思うのですが、できれば機械学習や統計解析、データマイニングに応用できればと思っております。 どちらのほうが適当でしょうか? 機械学習、統計解析、データマイニングでやることは違ってくるとは思うのですが、回答よろしくお願いします。 一応C言語の基礎とjavaで簡単なGUIの作製ができるくらいは勉強しました。

    • 0評価
    • 3876PV
    elda elda 1週間前に 回答
  • 受付中

    回答
    2

    Pythonで3列のデータフレームを距離行列(類似度行列)に変換する方法を教えてください。

    前提・実現したいこと >>> import pandas as pd >>> df = pd.read_csv("test.csv") >>> df.shape (6204141, 3) >>> df.head() item1 item2 similar 0 AAA BBB 4.820050e-05 1 CCC DDD 1.61

    • 0評価
    • 181PV
    can110 can110 3ヶ月前に コメント
  • 受付中

    回答
    0

    re:dashの TextBox Widgetでjavascriptが動作しません

    re:dashの TextBox Widgetでjavascriptが動作しません。 javascript動作する方法や設定ミスをどなたか指摘くださいませんでしょうか。 Redash 1.0.1+b2833 の Add Widgetから 作成できる Text Box に 以下のようなJavascript & HTML を埋

    • 0評価
    • 245PV
    teratailが3ヶ月前に アップデート
  • 解決済

    回答
    1

    (pandas)データの置換、隣の列の文字列とマッチング

    いつもお世話になっております。質問です。 !!実現したいこと!! C列における文字列をA列→B列で定義された文字列に置換したい。 dat.csv A列 B列 C列 B245 あいうえお B245|C234 C234 かきくけこ B245|C234|B245|C234 !!実現希望の結果!! A列→B列の定義をC

    • 0評価
    • 234PV
    Tweet_from_JG Tweet_from_JG 5ヶ月前に 回答
  • 受付中

    回答
    0

    Rで線形判別分析での予測

    線形判別分析で予測したいのですが、 Error in lda.default(x, grouping, ...) : variable 2 appears to be constant within groups というエラーが出ます。これはどういうエラーですか? 以下がソースコードです library(MASS) fit.lda <-

    • 0評価
    • 292PV
    teratailが8ヶ月前に アップデート
  • 解決済

    回答
    1

    swiftで形態素解析

    私は、swift3.0で文章を形態素解析してそれぞれの品詞ごとに文字を色分けして表示しようとしています。 現在は以下のコードにより形態素解析は行えています。 func tag(text: String, scheme: String) -> [TaggedToken] { let options: NSLinguisticTagg

    • 0評価
    • 342PV
    Takegawa Takegawa 9ヶ月前に ベストアンサー
  • 解決済

    回答
    1

    データ分類のプログラムの作成が出来ません

    前提・実現したいこと ここに質問したいことを詳細に書いてください クラスタリングのプログラムを作成中 与えたデータに対してランダムに代表点を決めその代表点から最も遠い点を計算し その最も遠い点から決めたデータ数分近いデータを同じグループとして分類するプログラムです 決められたデータ数未満のデータが残った場合そのデータと分けられたそれぞれの代表点との

    • 0評価
    • 423PV
    kouk kouk 10ヶ月前に ベストアンサー
  • 解決済

    回答
    12

    「誰にも負けないような得意な分野」がありましたら教えて下さい!

    "組織で働くなら、なにかひとつ「ここだけは誰にも負けない」という分野を持つことが大切だ。" といったことが書かれてる記事を見ました。 私もそういった分野を持ちたいと思いました。 スクレイピングに興味があるのですが、スクレイピングは得意なら強みになるというか必要とされる分野でしょうか? これから必要とされるであろう分野はありますか? みなさんは、具体的にどうい

    • 0評価
    • 1634PV
    popula popula 1年以上前に ベストアンサー
  • 受付中

    回答
    0

    ダミー変数を正規化することのメリットを教えてください

    回帰分析において、説明変数に1、0のダミー変数を使った分析を行うことがありますが、その際に、説明変数に用いるダミー変数を正規化することのメリットをご教示ねがえませんでしょうか

    • 0評価
    • 456PV
    teratailが1年以上前に アップデート
  • 解決済

    回答
    2

    Jsonファイルの中の単語の数をカウントするコードの書き方が知りたいです

    Jsonファイルの中の単語の数をカウントするコードの書き方が知りたいです やりたいことは、例えば以下のようなJsonファイルがあった場合に、 [ {id:1, legend:"apple"}, {id:2, legend:"orange"}, {id:3, legend:"orange"}, {id:4, legend:"apple"}, {i

    • 0評価
    • 615PV
    AudioStakes AudioStakes 1年以上前に コメント
  • 解決済

    回答
    1

    Googleスプレッドシートでχ二乗検定をする関数

    Googleスプレッドシートでχ二乗検定をする関数はありますか? ExcelだとCHITEST関数で、実測値と期待値を渡せば、すぐ優位度を出してくれますがスプレッドシートにそのような関数はないですか?

    • 0評価
    • 1192PV
    null368 null368 1年以上前に ベストアンサー
  • 受付中

    回答
    1

    事前確率という概念について

    事前確率という概念とその周辺のことが良く分かりません。 事後確率は条件付確率のことだというのはなんとなくわかるのですが、事後確率P(A|B)に対して事前確率P(A)なのであれば事前確率というのは周辺確率に対応する概念なのでしょうか?Wikipediaを見ると「事前確率に尤度関数の出力値を掛けると事後確率が得られる」とありますが、こちらのページには尤度は確率と

    • 0評価
    • 687PV
    Victorian-Vat Victorian-Vat 1年以上前に 回答を編集
  • 解決済

    回答
    2

    デザイナーがデータ見ることの障壁の乗り越え方

    ランサーズさんの資料の中で、デザイナーもデータを見ることが大切だという意見がございましたが、一切、データを触っていないデザイナーにデータを扱わせるにはどのようにすればよろしいでしょうか。 仕事の中で、本人にデータを見させても、あまり生産的な分析ができるとは正直感じません。 アドバイスをなどありましたらよろしくお願いします。

    • 0評価
    • 604PV
    naoyan naoyan 1年以上前に コメント
  • 解決済

    回答
    2

    pythonで文章内の改行数を数える方法

    pythonやmecabを使って文章内に出現する改行数をカウントしたいのですが、良い方法が見つかりません。 教えていただけませんでしょうか? 例: これはサンプルです。 これはサンプルです。

    • 0評価
    • 994PV
    mae mae 1年以上前に コメント
  • 解決済

    回答
    1

    SQLで実現したいことがあります(ユーザ利用遷移表)

    ========== 追記2です =========== hirohiro さん>> コメントありがとうございます。 利用日, UserID, GameName 5/1, ID1, Game1 6/2, ID1, Game2 6/3, ID1, Game3この場合ですと、 結果は 5月\6月 Game1 Game2 Game3 Game1

    • 0評価
    • 558PV
    terachan 退会済みユーザー 1年以上前に 質問を編集
  • 解決済

    回答
    1

    別プロセスで常駐させた方が良さそうな重い読み込み処理

    このページの後半のプログラムを利用したちょっとしたサービスを開発しています。 このページの解説にも「TSTの構築にちょっと時間かかるけど」とある通り、この大きなファイル(単語リスト)の読み込み(及びTSTの構築)が非常に重く、そしてほとんどの時間がかかります。 そこでTSTの読み込みを別プロセスで行い、デーモンのように常駐させると良いのではないかと思い至りま

    • 0評価
    • 1074PV
    KenjiOkada KenjiOkada 1年以上前に ベストアンサー
  • 1

タグ情報

  • あなたの順位

    -

  • タグ登録者数

    56

  • 総質問数

    16

  • 今週の質問数

    0

関連するタグ

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る