Pythonのnumpy配列のfor文における値変更について自力では解決できない疑問がありますので、質問させて頂きます。 ###疑問点例えば、以下のようなnumpyの2次元のリストがあったとします。 ```python In [1]: import numpy as np In [2]: twodim_array = np.arange(9).reshape(3,3) In [3]: twodim_array Out[3]: array([[0, 1, 2], [3, 4, 5], [6, 7, 8]]) ``` これをfor文で回して、中のリストの値を変更しようとすると、以下のように元のリスト（twodim_array）の内容が変更される事が確認できます。 ```python In [4]: for array in twodim_array: ...: array[1] = 5 ...: In [5]: twodim_array Out[5]: array([[0, 5, 2], [3, 5, 5], [6, 5, 8]]) In [6]: ``` しかし、例えば以下のように要素がintの配列の中身を変えようとしても、元の配列の内容は変更されません。 ```python In [7]: onedim_array = np.arange(3) In [8]: onedim_array Out[8]: array([0, 1, 2]) In [9]: for int_val in onedim_array: ...: int_val = 5 ...: In [10]: onedim_array Out[10]: array([0, 1, 2]) In [11]: ``` この２つの違いは何でしょうか。前者は、listの中身がmutable,後者はimmutableである事かと思い、以下のように確認してみましたが、謎が深まるばかりで理解できませんでした。 ###考察 for文によって参照されているオブジェクトが元のオブジェクトかどうか？？ ```python In [11]: for array in twodim_array: ...: print(id(array)) ...: 4674307536 4674308736 4674307536 In [12]: for array in twodim_array: ...: print(id(array)) ...: 4673935360 4674307536 4673935360 In [13]: for array in twodim_array: ...: print(id(array)) ...: 4674557392 4673935360 4674557392 In [14]: In [14]: id(twodim_array[0]) Out[14]: 4673766544 In [15]: id(twodim_array[1]) Out[15]: 4673936160 In [16]: id(twodim_array[2]) Out[16]: 4585491872 In [17]: ``` 要素がnumpyであるnumpy配列（２次元）のfor文によって参照されるオブジェクトは、元のオブジェクトと違うようですし、しかも、毎回別のものが参照されている。そして、さらに分からないのが、for文の中で0番目と2番目のオブジェクトIDが同じ番号になっている！以下のように、intを要素にもつnumpy配列でも似たような結果となりました。 ```python In [17]: for int_val in onedim_array: ...: print(id(int_val)) ...: 4671588584 4671588608 4671588584 In [18]: for int_val in onedim_array: ...: print(id(int_val)) ...: 4671588632 4671588584 4671588632 In [19]: for int_val in onedim_array: ...: print(id(int_val)) ...: 4671588656 4671588632 4671588656 In [20]: id(onedim_array[0]) Out[20]: 4671588680 In [21]: id(onedim_array[1]) Out[21]: 4671588704 In [22]: id(onedim_array[2]) Out[22]: 4671588728 In [23]: ``` ## まとめ以下の点を含めて、説明できる方がいらっしゃいましたら、教えていただけないでしょうか。。。・for文でのオブジェクトidと[int]で参照した時のオブジェクトidが違うのに、何故、元のリストの値を更新する事ができるのか。。・for文の中で0番目と2番目のオブジェクトidが等しいのは何故か。・intを要素に持つnumpy配列は、for文によって元のnumpy配列の値を変更する事はできないが、numpyを要素に持つnumpy配列は、for文によって元の配列を変更できるのは何故か。。よろしくお願いいたします。

「まとめ」で挙げられている質問には答えてません。ただ始めの方で気になったことがあったのでそのことについてのみ回答させていただきます。ご了承ください。m(_ _)m numpy云々関係なく、 ```python arr = [0,1,2] for n in arr: n = 5 ``` としたところで配列にアクセスしているわけではないですから、値は変わらなくて当然です。 C言語のポインタ等で説明すればいいのでしょうか？…とりあえず普通に説明してみます。 ```python twodim_arr = [[i for i in range(j*3,j*3+3)] for j in range(3)] for arr in twodim_arr: arr[1] = 5 ``` ここでarrに入るのは配列を指すアドレスと考えられます。ということはこのアドレスが指す配列の値を変更すれば当然、twodim_arrが持つアドレスが指す配列は同じものですから、結果的にtwodim_arrの持つ配列の中の値が変わることになります。一方最初の例ではnに入るのはただの整数値ですから、これを変えたところで配列にはなんの影響もありません。 numpyもこの仕様に合わせているのではないでしょうか？ ## ○蛇足的な何か全ての要素を5にするような操作をしたければ普通に ```python arr = [5,5,5] ``` とするか、要素数不明なら ```python arr = [5 for _ in arr] ``` と書くと良いでしょう。

(Python)for文でのNumpy配列のelements変更について

Pythonのnumpy配列のfor文における値変更について自力では解決できない疑問がありますので、質問させて頂きます。
###疑問点
例えば、以下のようなnumpyの2次元のリストがあったとします。

python
1In [1]: import numpy as np
2
3In [2]: twodim_array = np.arange(9).reshape(3,3)
4
5In [3]: twodim_array
6Out[3]: 
7array([[0, 1, 2],
8       [3, 4, 5],
9       [6, 7, 8]])

これをfor文で回して、中のリストの値を変更しようとすると、以下のように元のリスト（twodim_array）の内容が変更される事が確認できます。

python
1In [4]: for array in twodim_array:
2   ...:     array[1] = 5
3   ...:     
4
5In [5]: twodim_array
6Out[5]: 
7array([[0, 5, 2],
8       [3, 5, 5],
9       [6, 5, 8]])
10
11In [6]:

しかし、例えば以下のように要素がintの配列の中身を変えようとしても、元の配列の内容は変更されません。

python
1In [7]: onedim_array = np.arange(3)
2
3In [8]: onedim_array
4Out[8]: array([0, 1, 2])
5
6In [9]: for int_val in onedim_array:
7   ...:     int_val = 5
8   ...:     
9
10In [10]: onedim_array
11Out[10]: array([0, 1, 2])
12
13In [11]:

この２つの違いは何でしょうか。
前者は、listの中身がmutable,後者はimmutableである事かと思い、以下のように確認してみましたが、謎が深まるばかりで理解できませんでした。

###考察
for文によって参照されているオブジェクトが元のオブジェクトかどうか？？

python
1In [11]: for array in twodim_array:
2    ...:     print(id(array))
3    ...:     
44674307536
54674308736
64674307536
7
8In [12]: for array in twodim_array:
9    ...:     print(id(array))
10    ...:     
114673935360
124674307536
134673935360
14
15In [13]: for array in twodim_array:
16    ...:     print(id(array))
17    ...:     
184674557392
194673935360
204674557392
21
22In [14]: 
23
24In [14]: id(twodim_array[0])
25Out[14]: 4673766544
26
27In [15]: id(twodim_array[1])
28Out[15]: 4673936160
29
30In [16]: id(twodim_array[2])
31Out[16]: 4585491872
32
33In [17]:

要素がnumpyであるnumpy配列（２次元）のfor文によって参照されるオブジェクトは、元のオブジェクトと違うようですし、しかも、毎回別のものが参照されている。
そして、さらに分からないのが、for文の中で0番目と2番目のオブジェクトIDが同じ番号になっている！
以下のように、intを要素にもつnumpy配列でも似たような結果となりました。

python
1In [17]: for int_val in onedim_array:
2    ...:     print(id(int_val))
3    ...:     
44671588584
54671588608
64671588584
7
8In [18]: for int_val in onedim_array:
9    ...:     print(id(int_val))
10    ...:     
114671588632
124671588584
134671588632
14
15In [19]: for int_val in onedim_array:
16    ...:     print(id(int_val))
17    ...:     
184671588656
194671588632
204671588656
21
22In [20]: id(onedim_array[0])
23Out[20]: 4671588680
24
25In [21]: id(onedim_array[1])
26Out[21]: 4671588704
27
28In [22]: id(onedim_array[2])
29Out[22]: 4671588728
30
31In [23]:

まとめ

以下の点を含めて、説明できる方がいらっしゃいましたら、教えていただけないでしょうか。。。

・for文でのオブジェクトidと[int]で参照した時のオブジェクトidが違うのに、何故、元のリストの値を更新する事ができるのか。。
・for文の中で0番目と2番目のオブジェクトidが等しいのは何故か。
・intを要素に持つnumpy配列は、for文によって元のnumpy配列の値を変更する事はできないが、numpyを要素に持つnumpy配列は、for文によって元の配列を変更できるのは何故か。。

よろしくお願いいたします。

行動規範の内容に同意します

回答3件

ベストアンサー

numpy.arrayの中身を取り出そうとすると必ず決まったメモリに割り当てられるみたいですね。
0番目と2番目が等しいというより、その取り出し方だと、0,2,4,6,8,...が同じidになります。
ついでに

python
1a = np.arange(10)
2id(a[0])
3id(a[0})
4id(a[0})
5b = np.arange(10)
6id(b[0})
7id(a[0})

としても同じidが交互に現れます。
numpyが作業用に持つスタックメモリに乗せてから処理しているように思いますが、コードを直接読んだわけではないので確証はありませんが。
https://stackoverflow.com/questions/35232406/why-is-a-for-over-a-python-list-faster-than-over-a-numpy-array

値の更新についてはmutable、immutableに関係しています。
取り出した要素がimmutableの場合、等号はその要素を示していた変数の指す場所をかえます。
これに対してmutableの要素の場合、等号はmutableの要素の中身の指す場所をかえます。

python
1import numpy as np
2
3a = np.ones((4,4))
4print(a)
5for v in a:
6    v = np.zeros(4)
7print(a)
8for v in a:
9    v[:] = np.zeros(4)
10print(a)

投稿2018/01/04 03:06

印字順	印字対象のオブジェクト
#1	変数aの箱に入っているlistオブジェクト
#2	リストの先頭要素(つまり1)
#3	リストの2番目の要素(つまり1)
#4	リストの3番目の要素(つまり2)