質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

1回答

1106閲覧

特徴量が独立していないデータの機械学習について

chem_search

総合スコア30

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/04/20 13:29

教えて頂きたいこと

あるデータの特徴量が独立しているのではなく、あるグループごとに関連している場合の
機械学習での処理方法についてアドバイスを頂きたいです。

簡単な例を挙げます。
物質Aと物質Bを色々な割合で混ぜ合わせた水溶液の物性データをもとに
未知の割合で混ぜ合わせた水溶液の物性を予測したいとします。
このとき、データは
物質A 物質B 物性 
1% 1% 0.5
2% 2.5% 2.1
のようになるかと思います。
これだけであれば、物質Aと物質Bの濃度を特徴量として物性を予測する
モデルが組めるかと思います。
しかしこのとき、物質A,Bもデータで表せたら(例えば分子量や融点のような固有の値)
この予測モデルは物質C,Dにも拡張できるかもしれません。
(もちろんやってみないとわからないですが)

そのようなことを行いたい場合、各列の情報は独立しているわけではないので、
分子量〇〇、融点△△の物質が1%、
分子量□□、融点××の物質が2%、
このときの物性が~~
というまとまりがひとつのデータになります。

こういった形のデータをデータセットとして表す場合、どのようにすればよいのでしょうか。
またこういったデータを処理する場合に汎用される機械学習のモデル等は
どういったものがあるでしょうか。

参考になるサイトや書籍だけでも教えて頂けますと嬉しいです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hayataka2049

2020/04/20 13:48

この手の問題は機械学習で解くよりはシミュレーションした方が良いのでは?
chem_search

2020/04/20 14:11

おっしゃる通り、理想的にはシミュレーションのほうが良い問題ではあると思っています。 ですが、質問の例に挙げたものはだいぶ単純化した例でして、現在化学系の企業に研究職として勤務しているのですが、多成分系でのシミュレーションを実際にやろうとすると、いくつかの前提をおかなければいけなかったり、その系に適したシミュレーションが可能なソフトなどを用意しなければならない等、ハードルが高いと感じています。 また、シミュレーションでは純粋な物質を用いて計算しますが、実際の検討を行う際には純度100%ということはありえず、何かしらの測定値などを使ってデータを整理したりなどするため、どうしても実際のデータと乖離が生じます。 質問内容のような形で機械学習を行い、未測定の物性を計算できれば業務の簡略化等に役立つと考え、質問させていただきました。
guest

回答1

0

物質A 物質B 物性 

1% 1% 0.5
2% 2.5% 2.1

このようなデータをたくさん集めて,物質A,物質Bを特徴量として物性を予測(回帰)するモデルを構築すれば良いと思います

この記事などが参考になると思います

投稿2020/04/25 12:58

dark-eater-kei

総合スコア1248

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問