データマイニング

データマイニングは、購買履歴やクレジットカードの利用履歴、電話の通話履歴など企業にある大量のデータを解析して、その中に隠れたパターンやルールを探し出す技術です。DMと略されることもあります。

RSS

  • 解決済

    回答
    1

    swiftで形態素解析

    私は、swift3.0で文章を形態素解析してそれぞれの品詞ごとに文字を色分けして表示しようとしています。 現在は以下のコードにより形態素解析は行えています。 func tag(text: String, scheme: String) -> [TaggedToken] { let options: NSLinguisticTagg

    • 0評価
    • 69PV
    Takegawa Takegawa 1ヶ月前
  • 解決済

    回答
    1

    データ分類のプログラムの作成が出来ません

    前提・実現したいこと ここに質問したいことを詳細に書いてください クラスタリングのプログラムを作成中 与えたデータに対してランダムに代表点を決めその代表点から最も遠い点を計算し その最も遠い点から決めたデータ数分近いデータを同じグループとして分類するプログラムです 決められたデータ数未満のデータが残った場合そのデータと分けられたそれぞれの代表点との

    • 0評価
    • 138PV
    kouk kouk 2ヶ月前
  • 解決済

    回答
    12

    「誰にも負けないような得意な分野」がありましたら教えて下さい!

    "組織で働くなら、なにかひとつ「ここだけは誰にも負けない」という分野を持つことが大切だ。" といったことが書かれてる記事を見ました。 私もそういった分野を持ちたいと思いました。 スクレイピングに興味があるのですが、スクレイピングは得意なら強みになるというか必要とされる分野でしょうか? これから必要とされるであろう分野はありますか? みなさんは、具体的にどうい

    • 0評価
    • 1199PV
    popula popula 1年以上前
  • 受付中

    回答
    0

    ダミー変数を正規化することのメリットを教えてください

    回帰分析において、説明変数に1、0のダミー変数を使った分析を行うことがありますが、その際に、説明変数に用いるダミー変数を正規化することのメリットをご教示ねがえませんでしょうか

    • 0評価
    • 181PV
    hermitagejp hermitagejp 6ヶ月前
  • 解決済

    回答
    2

    Jsonファイルの中の単語の数をカウントするコードの書き方が知りたいです

    Jsonファイルの中の単語の数をカウントするコードの書き方が知りたいです やりたいことは、例えば以下のようなJsonファイルがあった場合に、 [ {id:1, legend:"apple"}, {id:2, legend:"orange"}, {id:3, legend:"orange"}, {id:4, legend:"apple"}, {i

    • 0評価
    • 373PV
    AudioStakes AudioStakes 11ヶ月前
  • 解決済

    回答
    1

    Googleスプレッドシートでχ二乗検定をする関数

    Googleスプレッドシートでχ二乗検定をする関数はありますか? ExcelだとCHITEST関数で、実測値と期待値を渡せば、すぐ優位度を出してくれますがスプレッドシートにそのような関数はないですか?

    • 0評価
    • 638PV
    null368 null368 1年以上前
  • 解決済

    回答
    2

    pythonで文章内の改行数を数える方法

    pythonやmecabを使って文章内に出現する改行数をカウントしたいのですが、良い方法が見つかりません。 教えていただけませんでしょうか? 例: これはサンプルです。 これはサンプルです。

    • 0評価
    • 504PV
    mae mae 1年以上前
  • 解決済

    回答
    1

    SQLで実現したいことがあります(ユーザ利用遷移表)

    ========== 追記2です =========== hirohiro さん>> コメントありがとうございます。 利用日, UserID, GameName 5/1, ID1, Game1 6/2, ID1, Game2 6/3, ID1, Game3この場合ですと、 結果は 5月\6月 Game1 Game2 Game3 Game1

    • 0評価
    • 368PV
    terachan 退会済みユーザー 1年以上前
  • 受付中

    回答
    6

    javaとc++、どちらが統計解析、機械学習、データマイニングに向いていますか?

    オブジェクト指向言語を本格的に勉強しようと思うのですが、できれば機械学習や統計解析、データマイニングに応用できればと思っております。 どちらのほうが適当でしょうか? 機械学習、統計解析、データマイニングでやることは違ってくるとは思うのですが、回答よろしくお願いします。 一応C言語の基礎とjavaで簡単なGUIの作製ができるくらいは勉強しました。

    • 0評価
    • 2754PV
    yu-ki000 yu-ki000 1年以上前
  • 受付中

    回答
    1

    事前確率という概念について

    事前確率という概念とその周辺のことが良く分かりません。 事後確率は条件付確率のことだというのはなんとなくわかるのですが、事後確率P(A|B)に対して事前確率P(A)なのであれば事前確率というのは周辺確率に対応する概念なのでしょうか?Wikipediaを見ると「事前確率に尤度関数の出力値を掛けると事後確率が得られる」とありますが、こちらのページには尤度は確率と

    • 0評価
    • 500PV
    KenjiOkada KenjiOkada 1年以上前
  • 解決済

    回答
    2

    デザイナーがデータ見ることの障壁の乗り越え方

    ランサーズさんの資料の中で、デザイナーもデータを見ることが大切だという意見がございましたが、一切、データを触っていないデザイナーにデータを扱わせるにはどのようにすればよろしいでしょうか。 仕事の中で、本人にデータを見させても、あまり生産的な分析ができるとは正直感じません。 アドバイスをなどありましたらよろしくお願いします。

    • 0評価
    • 431PV
    naoyan naoyan 1年以上前
  • 解決済

    回答
    1

    別プロセスで常駐させた方が良さそうな重い読み込み処理

    このページの後半のプログラムを利用したちょっとしたサービスを開発しています。 このページの解説にも「TSTの構築にちょっと時間かかるけど」とある通り、この大きなファイル(単語リスト)の読み込み(及びTSTの構築)が非常に重く、そしてほとんどの時間がかかります。 そこでTSTの読み込みを別プロセスで行い、デーモンのように常駐させると良いのではないかと思い至りま

    • 0評価
    • 722PV
    KenjiOkada KenjiOkada 1年以上前

タグ情報

  • あなたの順位

    -

  • タグ登録者数

    45

  • 総質問数

    12

  • 今週の質問数

    0

関連するタグ

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る