質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1646閲覧

外付けSSD上でデータ解析をしたい

Noriri12

総合スコア8

Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2022/05/31 06:11

前提

データ量の多いデータを解析したいと考えています.
PC上で解析を行ったところ,ディスク(HDD)の使用量が100%となっている状況で,解析時間が膨大に掛かってしまいました(読み書きのスピードが非常に遅い)
そこで外付けSSDを導入し,読み書きのスピードをアップさせようとしました.
SSDはPCに認識されています.

困っていること

解析対象データをSSD上にコピーし,解析を行いましたが,解析時間は全く減りません.
タスクマネージャーのパフォーマンスを確認すると,HDDのアクティブ時間はほぼ100%,SSDのアクティブ時間は0% となっており,SSD上で解析ができていなさそうなことがわかりました.
おそらく,データを読むところと結果を書き出すところはSSDに指定できており早いのですが,その計算過程をHDD上で行っているので,解析時間が変わらないのだと思います.

実現したいこと

SSD上で読み書きの計算を行うことで解析時間を減らしたいです.
SSD上で計算を行うように指定する関数などあるのでしょうか?
また,解析にはanacondaのpython3.1を用いています.このライブラリをSSDにインストールするしかないのでしょうか?
PC関連について初心者なので,どうすればよいか検討がつきません...

補足情報(FW/ツールのバージョンなど)

anaconda python3.1

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jbpb0

2022/05/31 08:50 編集

> タスクマネージャーのパフォーマンスを確認すると,HDDのアクティブ時間はほぼ100%,SSDのアクティブ時間は0% の時に、メモリーの使用量はトータルで何%くらいですか?
Noriri12

2022/05/31 08:55

メモリの使用量は以下のようになっています. 通常時:60%前後 プログラム走らせているとき:90%前後 かなりメモリを使用しているのも問題だとは思っています...
TakaiY

2022/05/31 09:05 編集

解析に使っているプログラムはどのようなものですか? 中間データをストレージに書き出すようになっているのであれば、そのプログラムの設定を変更するしかありません。作者に聞くのがいちばんです。 自分はメモリが足りなくてスワップしているのが原因ではないかと思ってます。 もし、Pandasなどのライブラリが裏でやっていると思っているのだとしたら、間違えています。回答の質問欄にあるようなライブラリはそのようなことをしません。
Noriri12

2022/05/31 09:27

ざっくりした流れは,データを読みこみ配列に格納し,高速フーリエ変換をし,Excelに出力という感じです.(諸事情があり,プログラムを詳細にお伝えすることができず申し訳ございません) スワップについて詳しくないので再度調べてみようと思います.ありがとうございます!
jbpb0

2022/05/31 09:50 編集

> スワップについて 参考 https://pc-kaizen.com/win10-virtual-memory 上記WebページにはDドライブにだけ設定するように書かれてますが、外付けSSDを外してパソコン使う場合もあるならCドライブにも(小さいサイズで)設定しておいた方がいいかも
Noriri12

2022/06/01 09:20

参考サイトありがとうございます!解決しました!
guest

回答1

0

ベストアンサー

状況から、計算処理において以下が発生している可能性が考えられます。

1.物理メモリが足りずスワップが発生している。
2.計算処理が内部でテンポラリなど一時ファイルを利用し、その場所がHDD上になっている。
3.計算処理を担うライブラリが、たとえば巨大な辞書のようなデータを内包しており、それを参照している。

1.の場合は物理メモリを増やすか、スワップ領としてHDDではなくSDDを指定する。
2.の場合はテンポラリパスとしてHDDではなくSSDを指定する。
3.の場合は、ライブラリの内、データのみをSSDに配置する。

と解消する可能性があります。
なおPython含めライブラリの配置先はHDDのままでよいです。

投稿2022/05/31 06:50

編集2022/05/31 06:54
can110

総合スコア38266

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Noriri12

2022/05/31 08:29

ありがとうございます! おそらく2が原因だと考えています ただ,テンポラリパスの指定方法がわからなかったため,詳しく教えていただけると幸いです... 一応,ネットで調べはしたのですが,フォルダを作成する方法ばかり出てきて,計算処理内部のパスの指定方法が出てきませんでした...(調べ方が悪いのだと思うのですが) また,計算に用いている関数(?)は,openCV・numpy・pandasの3つです.
can110

2022/05/31 10:31

追記内容を見る限り、2のテンポラリではなく1のスワップが発生している可能性が高いです。 追記・修正依頼欄で提示されているリンク先を参考にスワップ領域をSSDに設定すると解消するかもしれません。
Noriri12

2022/06/01 09:20

解決しました!スワップが原因でした,ありがとうございます...!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問