質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

4回答

1185閲覧

【データ分析】人毎の熟練度を考慮した分析をしたい

Tadokoro

総合スコア14

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/02/18 07:55

編集2019/02/18 08:06

現在、掘削機を操縦している時のデータの分析を業務で行っております。
掘削機の運転データ(速度、回転数、ガス圧等)から、掘削してる岩盤の強度を予測させるのが目的です。

ただし、この機械を操縦している人が早番遅番で変わり、操縦者によって運転データの傾向が変わってしまいます。
(午前中は相関が出ていた特徴量が、午後のデータでは相関が無くなっていたりする)

現場担当者の方の意見では「ベテランと若手だと相当腕に差がある」とのことで
そういった、個人差を考慮したうえでデータ分析をする手法があれば教えてください!
※どう調べればいいのかもよくわからないため「こういうキーワードで調べるといいよ!」的なのも歓迎です!!

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kabao

2019/02/18 07:59

分析の目的を書いたほうがいいと思います。
Tadokoro

2019/02/18 08:06

ありがとうございます。 目的を追記してみました。
hayataka2049

2019/02/18 09:32

いつ誰が運転していたのかはデータとして取ってますか?
Tadokoro

2019/02/19 00:50

誰が(熟練者か、そうでないか)という情報はありません。早番と遅番で人が変わるということだけわかっています。
guest

回答4

0

ベストアンサー

stanを使った階層ベイズ推計がいいように思います。これであれば、各人共通のパラメータを推計した上で、各人の運転データの差異もうまくモデリングできる可能性があります。さらにいうと、stanはサンプリングによってパラメータを推計するので、データの件数が少なくても結構うまくいきます。(もちろん、データが多いほうがうまくいきやすくなるのですが…)
難点は、事前に理解しなければならないことが結構多いということです。最尤推定から始まり、ベイズ推計・MCMC・Stan(pystan)などなどです。一度、調べてみるといいかと思います。

投稿2019/02/18 14:40

R.Shigemori

総合スコア3376

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Tadokoro

2019/02/19 01:42

データが少なくてもある程度精度が出る手法を提案していただいたのでベストアンサーにさせていただきます!stan、名前はよく見ますが使ったことがないため、この機会に勉強してみます!ありがとうございました。
guest

0

十分な項目(速度、回転数、ガス圧、その他・・・)と、十分な行数のデータがあれば、回帰分析ぐらいはできるんじゃないかと思いますが、さらに何か問題があるのでしょうか。

操縦者ごとに使い方が少し違っているのだと思いますが、多数のデータがあれば平均化できるのでは?
または、それらの操縦者の違いを表現するようなデータ項目があれば(一番単純に考えると「操縦者」も項目に含めるとか)、その違いも反映して分析できるのではないでしょうか。

午前中相関があったものが、午後はなくなるというのは、単にデータの数が少ないだけの可能性もあるのではないでしょうか。

投稿2019/02/18 12:05

kabao

総合スコア648

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Tadokoro

2019/02/19 00:56

回答ありがとうございます!現状はデータの数がかなり少ないので、今後データを追加で収集してもらう予定にしています。データの数が揃って来ればおのずと精度も出てきそうですかね!
guest

0

担当者を結び付けられるようなデータを取っていて、担当者ごとに十分なデータ数があれば、担当者ごとに分析してみるのが手っ取り早いでしょう。層別といったりします(そんな大げさではありませんが)。

上の条件を満たさなければ、kabaoさんの回答とかぶりますが、無視してまるごと分析。

投稿2019/02/18 13:01

hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Tadokoro

2019/02/19 00:58

回答ありがとうございます。私も担当者の情報が欲しかったのですが、現状はありません。データが集まるのを待ってみます!
guest

0

ベテランと若手を分けたいということであれば、k-meansの利用を検討してみてはいかがでしょうか?

投稿2019/02/18 09:52

syuuichi

総合スコア35

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Tadokoro

2019/02/19 00:54

すみません、今回はベテランと若手のデータに分けたいわけではありません。ただ、K-meansの記事も調べてみて別の案件で使えそうでした!ありがとうございます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問