質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

878閲覧

pythonでマウスで描いた絵から構造式を推測、分子式を出力

Yudai.M

総合スコア1

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/10/15 09:45

前提・実現したいこと

化学計算で用いるプログラムを作成したいと考えております。

質問は
「pythonを用いてマウスで描いた形から構造式を推測し、そこから分子式を出力させる」という最初の入り口を作りたいのですが、pythonでこの動作を作成するにはどのようにすればいいのか、ご教授いただけないでしょうか。

よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

ディープラーニングを使った画像認識で原理的には可能です。

手書きのアラビア数字を識別するTHE MNIST DATABASE of handwritten digitsの28×28ピクセルの訓練用画像6万個とテスト用画像1万個を使えば10種類の数字を見分けるようなシステムを作ることができます。

これから類推すると現在可能なのは以下のレベルでしょう。

炭素数4以下の直鎖炭化水素は以下の13種類です。
アルカン:メタン、エタン、プロパン、ブタン
アルケン:エチレン、プロピレン、α-ブチレン、β-ブチレン、イソブチレン
アルキン:アセチレン、メチルアセチレン、エチルアセチレン、ジメチルアセチレン

この13種類の直鎖炭化水素を区別するには28×28ピクセルの画像は無理ですので画像サイズをかなり大きくする必要があります。また、訓練用画像は10万個程度は必要になります。
ディープラーニングは画像サイズが大きくなると必要メモリ量と訓練時間が非常に増大しますので。現在のコンピュータでは炭素数が5とか6になるとできるかどうかはわかりません。

もし、アルコール、アルデヒド、カルボン酸などを含むと、酸素を認識する必要があるため画像サイズはさらに大きくする必要があり、炭素数3以下であっても現在のコンピュータでは無理なのではないかと思います。

投稿2021/10/15 12:09

ppaul

総合スコア24666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Yudai.M

2021/10/16 08:25

ご丁寧にありがとうございます。 現状、厳しそうな状況のようですね。 なんとかして、手書きや写真撮影から分子構造を読み取らせ、そこから炭素数、などを出力させたいのですが...
ppaul

2021/10/17 23:47

こういうものを欲しいと思う人はYudai.Mさんだけだと思いますか。 大学、研究機関、企業でも欲しいと思う人はたくさんいます。 日本の大学が約800校、その半分があたり年百万円払ってくれれば4億円、研究機関や企業を含めれば10億円ぐらいになるでしょう。日本のGDPの世界に占める比率は5.8%なので、世界全体では170億ぐらいの収入は可能かもしれません。これぐらいの市場規模があれば、GoogleレンズとかやっているGoogleが自前のTensorflowを使って、そういうサービスを広告収入でやると思いませんか? 明らかな需要があるにもかかわらずGoogleがやろうとしないことをYudai.Mさんが実現できるなら、今すぐソフトを開発してGoogleに売り込めば、高く買ってもらえると思います。 言い換えると、現状のハードウェア・ソフトウェアではたぶんできないことなのです。
Yudai.M

2021/10/18 10:02

ppaulさん、ご丁寧にありがとうございます。 プログラミングの勉強を始めたばかりなので、相当的外れな質問をしてしまったかもしれません、失礼いたしました.. とにかく難しいことがわかりました。 もっと簡略化したプログラムを模索してみます。。 ありがとうございました。
guest

0

化学については無知ですが、「構造式」「推測」など適当なキーワードで検索すると以下が見つかりました。
画像から構造式を抽出せよ!! (構造式をOCR?)
これは目的達成の一部として利用できないでしょうか。

投稿2021/10/18 00:53

can110

総合スコア38278

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問