質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
マルチスレッド

マルチスレッドは、どのように機能がコンピュータによって実行したのかを、(一般的にはスレッドとして参照される)実行の複合的な共同作用するストリームへ区分することが出来ます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

データマイニング

データマイニングは、購買履歴やクレジットカードの利用履歴、電話の通話履歴など企業にある大量のデータを解析して、その中に隠れたパターンやルールを探し出す技術です。DMと略されることもあります。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

解決済

1回答

4077閲覧

別プロセスで常駐させた方が良さそうな重い読み込み処理

KenjiOkada

総合スコア22

マルチスレッド

マルチスレッドは、どのように機能がコンピュータによって実行したのかを、(一般的にはスレッドとして参照される)実行の複合的な共同作用するストリームへ区分することが出来ます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

データマイニング

データマイニングは、購買履歴やクレジットカードの利用履歴、電話の通話履歴など企業にある大量のデータを解析して、その中に隠れたパターンやルールを探し出す技術です。DMと略されることもあります。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

1クリップ

投稿2014/11/18 01:23

このページの後半のプログラムを利用したちょっとしたサービスを開発しています。
このページの解説にも「TSTの構築にちょっと時間かかるけど」とある通り、この大きなファイル(単語リスト)の読み込み(及びTSTの構築)が非常に重く、そしてほとんどの時間がかかります。
そこでTSTの読み込みを別プロセスで行い、デーモンのように常駐させると良いのではないかと思い至りました。
その場合、CGI(解析するテキストを指定する・入力は10000文字程度までを想定)とTSTデーモンの通信はどのように行うのが一般的なのでしょうか?
素人ながら調べてみたところデーモンの標準入出力は無効化しなければいけないようなので、パイプで渡すことはできないと判断しました。しかし、ではソケットなのか?それともファイルを作って共有なのか?あるいは私の知らない全く別の方法なのか?というところで悩んでいます。
そもそも今回の場合別プロセス(デーモン)にするのがベストなのかどうかも悩んでいます。
皆様のお知恵を拝借できればありがたく存じます。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

いつくか方法は考えられますが、
プロセス間通信、共有メモリ、データベース、KVSなども考えられると思います。
Webアプリから使うのには何がいいかはよくわかりませんが…

投稿2014/11/18 01:33

TaMaMhyu

総合スコア1356

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

KenjiOkada

2014/11/18 02:12

ありがとうございます。確かにデータベースという手もありますね。データベースでデータを共有してシグナルで通知という手が良いかもしれません。他に特になければそれで行きたいと思います。
TaMaMhyu

2014/11/18 02:24

Webアプリの場合、Webサーバ複数台構成だと、プロセス間通信と共有メモリは使えなそうですね。
KenjiOkada

2014/11/18 04:19

色々調べてみたんですが、シグナルは強制終了とかに使われる手段で、処理して欲しいというようなメッセージを送る手段としては一般的ではないんですね。複数台構成とか考えるような大規模なサービスではないんですが、Webアプリということでデーモンとユーザープロセスの間に親子関係がないので、そこで調べるのに苦労してます。何か良い情報源はないでしょうか?
KenjiOkada

2014/11/18 04:28

プロセスの間に親子関係があればmultiprocessingクラスのPipeとかも使えそうなんですが・・・。やはりソケットとか使うことになるんでしょうか?
TaMaMhyu

2014/11/18 04:44

データベースでやる場合であれば、データベースの中に状態を持って、ポーリング(一定周期で監視)するという手法があります。 ただ、Webアプリのクライアント側とどうやりとりするかは別途検討が必要になるかと思います。
TaMaMhyu

2014/11/18 04:49

クライアント側としてはAjaxで定期的にアクセスして状態や結果を取ってくるとか、 WebSocketなどの常時接続の方法を使うかなどが考えられます。
KenjiOkada

2014/11/18 05:31

なるほど。色々と本当にありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問