データマイニング

データマイニングは、購買履歴やクレジットカードの利用履歴、電話の通話履歴など企業にある大量のデータを解析して、その中に隠れたパターンやルールを探し出す技術です。DMと略されることもあります。

RSS

  • 受付中

    回答
    0

    InstagramAPIと連動してハッシュタグからデータ分析を行えるシステムを開発したい

    開発したいもの webブラウザ上でInstagramのハッシュタグを入力することで、投稿に付与されたロケーション情報や一緒に投稿されやすいハッシュタグなどを抽出してグラフ化できるようなシステムを開発したいです。 解決したい問題 「データを集めて、グラフとして出力する」といったシステムを実現するためにはどのような切り口(技術・言語・必要な知識など

    • 0評価
    • 56PV
    noe noe 1週間前
  • 解決済

    回答
    1

    (pandas)データの置換、隣の列の文字列とマッチング

    いつもお世話になっております。質問です。 !!実現したいこと!! C列における文字列をA列→B列で定義された文字列に置換したい。 dat.csv A列 B列 C列 B245 あいうえお B245|C234 C234 かきくけこ B245|C234|B245|C234 !!実現希望の結果!! A列→B列の定義をC

    • 0評価
    • 43PV
    Tweet_from_JG Tweet_from_JG 2週間前
  • 受付中

    回答
    0

    Rで線形判別分析での予測

    線形判別分析で予測したいのですが、 Error in lda.default(x, grouping, ...) : variable 2 appears to be constant within groups というエラーが出ます。これはどういうエラーですか? 以下がソースコードです library(MASS) fit.lda <-

    • 0評価
    • 155PV
    cde cde 3ヶ月前
  • 解決済

    回答
    1

    swiftで形態素解析

    私は、swift3.0で文章を形態素解析してそれぞれの品詞ごとに文字を色分けして表示しようとしています。 現在は以下のコードにより形態素解析は行えています。 func tag(text: String, scheme: String) -> [TaggedToken] { let options: NSLinguisticTagg

    • 0評価
    • 174PV
    Takegawa Takegawa 5ヶ月前
  • 解決済

    回答
    1

    データ分類のプログラムの作成が出来ません

    前提・実現したいこと ここに質問したいことを詳細に書いてください クラスタリングのプログラムを作成中 与えたデータに対してランダムに代表点を決めその代表点から最も遠い点を計算し その最も遠い点から決めたデータ数分近いデータを同じグループとして分類するプログラムです 決められたデータ数未満のデータが残った場合そのデータと分けられたそれぞれの代表点との

    • 0評価
    • 251PV
    kouk kouk 5ヶ月前
  • 解決済

    回答
    12

    「誰にも負けないような得意な分野」がありましたら教えて下さい!

    "組織で働くなら、なにかひとつ「ここだけは誰にも負けない」という分野を持つことが大切だ。" といったことが書かれてる記事を見ました。 私もそういった分野を持ちたいと思いました。 スクレイピングに興味があるのですが、スクレイピングは得意なら強みになるというか必要とされる分野でしょうか? これから必要とされるであろう分野はありますか? みなさんは、具体的にどうい

    • 0評価
    • 1392PV
    popula popula 1年以上前
  • 受付中

    回答
    0

    ダミー変数を正規化することのメリットを教えてください

    回帰分析において、説明変数に1、0のダミー変数を使った分析を行うことがありますが、その際に、説明変数に用いるダミー変数を正規化することのメリットをご教示ねがえませんでしょうか

    • 0評価
    • 290PV
    hermitagejp hermitagejp 9ヶ月前
  • 解決済

    回答
    2

    Jsonファイルの中の単語の数をカウントするコードの書き方が知りたいです

    Jsonファイルの中の単語の数をカウントするコードの書き方が知りたいです やりたいことは、例えば以下のようなJsonファイルがあった場合に、 [ {id:1, legend:"apple"}, {id:2, legend:"orange"}, {id:3, legend:"orange"}, {id:4, legend:"apple"}, {i

    • 0評価
    • 483PV
    AudioStakes AudioStakes 1年以上前
  • 解決済

    回答
    1

    Googleスプレッドシートでχ二乗検定をする関数

    Googleスプレッドシートでχ二乗検定をする関数はありますか? ExcelだとCHITEST関数で、実測値と期待値を渡せば、すぐ優位度を出してくれますがスプレッドシートにそのような関数はないですか?

    • 0評価
    • 867PV
    null368 null368 1年以上前
  • 解決済

    回答
    2

    pythonで文章内の改行数を数える方法

    pythonやmecabを使って文章内に出現する改行数をカウントしたいのですが、良い方法が見つかりません。 教えていただけませんでしょうか? 例: これはサンプルです。 これはサンプルです。

    • 0評価
    • 671PV
    mae mae 1年以上前
  • 解決済

    回答
    1

    SQLで実現したいことがあります(ユーザ利用遷移表)

    ========== 追記2です =========== hirohiro さん>> コメントありがとうございます。 利用日, UserID, GameName 5/1, ID1, Game1 6/2, ID1, Game2 6/3, ID1, Game3この場合ですと、 結果は 5月\6月 Game1 Game2 Game3 Game1

    • 0評価
    • 460PV
    terachan 退会済みユーザー 1年以上前
  • 受付中

    回答
    6

    javaとc++、どちらが統計解析、機械学習、データマイニングに向いていますか?

    オブジェクト指向言語を本格的に勉強しようと思うのですが、できれば機械学習や統計解析、データマイニングに応用できればと思っております。 どちらのほうが適当でしょうか? 機械学習、統計解析、データマイニングでやることは違ってくるとは思うのですが、回答よろしくお願いします。 一応C言語の基礎とjavaで簡単なGUIの作製ができるくらいは勉強しました。

    • 0評価
    • 3131PV
    yu-ki000 yu-ki000 1年以上前
  • 受付中

    回答
    1

    事前確率という概念について

    事前確率という概念とその周辺のことが良く分かりません。 事後確率は条件付確率のことだというのはなんとなくわかるのですが、事後確率P(A|B)に対して事前確率P(A)なのであれば事前確率というのは周辺確率に対応する概念なのでしょうか?Wikipediaを見ると「事前確率に尤度関数の出力値を掛けると事後確率が得られる」とありますが、こちらのページには尤度は確率と

    • 0評価
    • 592PV
    KenjiOkada KenjiOkada 1年以上前
  • 解決済

    回答
    2

    デザイナーがデータ見ることの障壁の乗り越え方

    ランサーズさんの資料の中で、デザイナーもデータを見ることが大切だという意見がございましたが、一切、データを触っていないデザイナーにデータを扱わせるにはどのようにすればよろしいでしょうか。 仕事の中で、本人にデータを見させても、あまり生産的な分析ができるとは正直感じません。 アドバイスをなどありましたらよろしくお願いします。

    • 0評価
    • 516PV
    naoyan naoyan 1年以上前
  • 解決済

    回答
    1

    別プロセスで常駐させた方が良さそうな重い読み込み処理

    このページの後半のプログラムを利用したちょっとしたサービスを開発しています。 このページの解説にも「TSTの構築にちょっと時間かかるけど」とある通り、この大きなファイル(単語リスト)の読み込み(及びTSTの構築)が非常に重く、そしてほとんどの時間がかかります。 そこでTSTの読み込みを別プロセスで行い、デーモンのように常駐させると良いのではないかと思い至りま

    • 0評価
    • 878PV
    KenjiOkada KenjiOkada 1年以上前
  • 1

タグ情報

  • あなたの順位

    -

  • タグ登録者数

    46

  • 総質問数

    15

  • 今週の質問数

    0

関連するタグ

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る