質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.32%

データフレーム、データベースの違いについて

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 1,271

yuujiMotoki

score 57

仕事では、もっぱらEXCELと解析ソフトのJMPを使っています

EXCELやJMPには、表計算できるUIが整っており、こういうアプリケーションを構築する場合、
いわゆるデータベース(SQL)ではなくて、データフレームというカテゴリになるのかと思っています。

例えば、PYTHONにおけるPANDASのようなものが、いろいろ今後の機械学習や、AIで
ニーズが高まっているように思います。

このようなライブラリは、現時点で私の知っている限り

言語
・VBA → EXCELのシート、セル計算
・PYTHON → PANDASデータフレーム
・JMP → JSL(スクリプト)

ぐらいだと思います。

SQLを使ったデータベースの世界は、かなり体系的に学べる書物などが多いのですが、
データフレームの世界というのは、一部の製品パッケージに依存しており、
まだまだ学問的な体系化ができていないように思います。

この手のジャンルにおける、アプリケーション開発をやっていく上で、
データフレームとデータベースの違いを、定義付けしたようなものはないでしょうか?

またデータフレーム寄りのことがしやすい、データベースというものは存在するでしょうか?
できれば.NETとの相性の良いライブラリや、言語としてjavascriptなどと共存できるものを
探しています(質問内容が抽象的で申し訳ありません)

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • KojiDoi

    2018/08/25 13:19

    https://teratail.com/help/avoid-asking 問題・課題が含まれていない質問 悪い例:「オススメの開発環境構築方法を教えてください」

    キャンセル

  • 退会済みユーザー

    2018/08/25 20:08

    複数のユーザーから「問題・課題が含まれていない質問」という意見がありました
    teratailでは、漠然とした興味から票を募るような質問や、意見の主張をすることを目的とした投稿は推奨していません。
    「編集」ボタンから編集を行い、質問の意図や解決したい課題を明確に記述していただくと回答が得られやすくなります。

回答 1

checkベストアンサー

+1

機械学習で有用なのは行列計算です。表計算ではありません。表計算で行列計算もできますが、いかに容易にそれを実現するかがポイントです。ですので、DBはデータソースとして利用し、行列計算・機械学習をデータフレーム処理系が行うというイメージとなるかと。

.NETとの相性の良いという意味では、WindowsMLが良さそうですし、データソースであれば、なんでも良いのではないでしょうか。
Windowsという意味では、SQLServerが良いのではないでしょうかね。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/08/26 14:39

    ありがとうございます。

    以下は自分なりの解釈ですが
    行列計算を目的としたライブラリであれば、PYTHONで言えばNUMPYにあたるのでしょう
    現時点では、行列計算の一歩手前の統計計算などの役割が、データフレームなのかと思っています。
    グラフ表示や、解析結果の可視化など・・・

    少しまとめますと
    データベース  データソースを格納、ストレージの役割   ACCESS    SQL 
    データフレーム データの統計計算、可視化         EXCEL     PANDAS
    行列ライブラリ 行列演算、機械学習PKG         R,MATHLAB  TENSOLFROW、NUMPY

    まだ機械学習やデータサイエンスに関して、あまり知見がないのですが、フレームワークとしては3重構造ぐらいにはなってくるのではないかと思います

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.32%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る