質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
OpenAI Gym

OpenAI Gymは、強化学習を開発・強化するためのシミュレーション環境です。強化学習における実験や評価環境などを標準化し提供することを目的としています。さらに、結果をアップロードしたり、他の人の実行結果や実装を見ることも可能です。

Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

PyTorch

PyTorchは、オープンソースのPython向けの機械学習ライブラリ。Facebookの人工知能研究グループが開発を主導しています。強力なGPUサポートを備えたテンソル計算、テープベースの自動微分による柔軟なニューラルネットワークの記述が可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Q&A

1回答

1774閲覧

Pytorchのcuda:0とcpuの分け方(D4RL/rlkit/CQL)

Sh1nn

総合スコア24

OpenAI Gym

OpenAI Gymは、強化学習を開発・強化するためのシミュレーション環境です。強化学習における実験や評価環境などを標準化し提供することを目的としています。さらに、結果をアップロードしたり、他の人の実行結果や実装を見ることも可能です。

Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

PyTorch

PyTorchは、オープンソースのPython向けの機械学習ライブラリ。Facebookの人工知能研究グループが開発を主導しています。強力なGPUサポートを備えたテンソル計算、テープベースの自動微分による柔軟なニューラルネットワークの記述が可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

0グッド

0クリップ

投稿2021/12/22 02:31

編集2021/12/22 02:38

D4RLデータセットを使ったCQL学習を実行する

https://github.com/aviralkumar2907/CQL を使っています
CQL/d4rl/examples/cql_mujoco_new.py を動かしたいです

必要な環境
CQL/d4rl/enviroment/linux-gpu-env.yml
全てのバージョンが古かったので、自分で今のバージョンをいれました

https://github.com/deepmind/mujoco/releases
2.1.1が必要です
https://github.com/openai/mujoco-py

terminal

1pip install mujoco_py

key:https://roboti.us/license.html
activationkeyがいります

mujocoの初期設定
https://scrapbox.io/programming-notes/MuJoCo%E3%82%A4%E3%83%B3%E3%82%B9%E3%83%88%E3%83%BC%E3%83%AB

home/.mujoco/mujoco-2.1.1/mujoco-2.1.1/hoge

となっているので一つ上げてください

home/.mujoco/mujoco-2.1.1/hoge

発生している問題・エラーメッセージ

Traceback (most recent call last): File "cql_mujoco_new.py", line 194, in <module> experiment(variant) File "cql_mujoco_new.py", line 104, in experiment algorithm.train() File "/home/kodama/CQL-master/d4rl/rlkit/core/rl_algorithm.py", line 46, in train self._train() File "/home/kodama/CQL-master/d4rl/rlkit/core/batch_rl_algorithm.py", line 170, in _train self.trainer.train(train_data) File "/home/kodama/CQL-master/d4rl/rlkit/torch/torch_rl_algorithm.py", line 40, in train self.train_from_torch(batch) File "/home/kodama/CQL-master/d4rl/rlkit/torch/sac/cql.py", line 237, in train_from_torch q1_rand = self._get_tensor_values(obs, random_actions_tensor, network=self.qf1) File "/home/kodama/CQL-master/d4rl/rlkit/torch/sac/cql.py", line 135, in _get_tensor_values preds = network(obs_temp, actions) File "/home/kodama/anaconda3/envs/cql-rlkit/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl return forward_call(*input, **kwargs) File "/home/kodama/CQL-master/d4rl/rlkit/torch/networks.py", line 87, in forward flat_inputs = torch.cat(inputs, dim=1) RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu! (when checking argument for argument tensors in method wrapper___cat)

該当のソースコード

terminal

1python ~/CQL-master/d4rl/examples/cql_mujoco_new.py

python

1#CQL-master/d4rl/rlkit/torch/networks.py 2 def forward(self, *inputs, **kwargs): 3 flat_inputs = torch.cat(inputs, dim=1) 4 # flat_inputs = torch.cat(inputs, dim=1).to(device)試したが失敗 5 return super().forward(flat_inputs, **kwargs)

試したこと

最初Pytorchとcudatoolkitがうまく繋がっていないのかと思いましたが、エラーからだと認識しているように見えます。
様々なdeviceの指定などがうまくできていないように思います。

補足情報(FW/ツールのバージョンなど)

terminal

1$conda list 2 Name Version Build Channel 3. 4. 5. 6cudatoolkit 11.1.74 h6bb024c_0 nvidia 7. 8d4rl 1.1 dev_0 <develop> 9. 10dm-control 0.0.416999250 pypi_0 pypi 11dm-env 1.5 pypi_0 pypi 12dm-tree 0.1.6 pypi_0 pypi 13. 14gtimer 1.0.0b5 pypi_0 pypi 15gym 0.21.0 pypi_0 pypi 16. 17. 18. 19matplotlib 3.3.1 0 anaconda 20matplotlib-base 3.3.1 py38h817c723_0 anaconda 21. 22mujoco-py 2.1.2.14 pypi_0 pypi 23ncurses 6.2 he6710b0_1 anaconda 24numba 0.51.2 py38h0573a6f_1 anaconda 25numpy 1.19.1 py38hbc911f0_0 anaconda 26numpy-base 1.19.1 py38hfa32c7d_0 anaconda 27. 28pip 20.2.4 py38_0 anaconda 29. 30pybox2d 2.3.10 py38h709712a_2 conda-forge 31. 32python 3.8.5 h7579374_1 anaconda 33python-dateutil 2.8.1 py_0 anaconda 34python_abi 3.8 2_cp38 conda-forge 35pytorch 1.10.1 py3.8_cuda11.1_cudnn8.0.5_0 pytorch 36pytorch-mutex 1.0 cuda pytorch 37. 38rlkit 0.2.1.dev0 dev_0 <develop> 39scipy 1.5.2 py38h0b6359f_0 anaconda 40. 41. 42.

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

投稿2021/12/22 06:40

ppaul

総合スコア24670

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Sh1nn

2021/12/27 06:26

回答ありがとうございます。返事が遅くなりすみません。 私も同じ記事を見つけて試してみたのですが、ダメでした;;
XiaoCai

2022/11/08 17:59

Hello, did you manage to solve this problem? I just encountered the same problem when I was trying to run CQL/d4rl/examples/cql_mujoco_new.py.
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問