🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

3回答

2113閲覧

配列同士の全組み合わせに対して、関数で定義した計算を通す

MagMag

総合スコア80

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

1クリップ

投稿2020/12/04 08:25

以下のaとbのように、それぞれ配列(ベクトル)が複数格納されたデータがあり、この配列同士の全組み合わせに対し、別の関数で定義した配列演算をしたいと思っています(この場合、決定係数という統計指標の算出を使っています)。

この時、for文を二つ回さずに実行する方法を教えていただけないでしょうか?
np.meshgridを使おうとしたのですが、なかなかうまくいかず、止まっています。

Python

1import numpy as np 2 3def calc(x,y): 4 return 1 - sum((x - y) ** 2) / sum((x - y.mean()) ** 2) 5 6a = np.array([[0, 0, 0, 0, ], [5, 5, 5, 10], [1, 2, 10, 12], [-3, 0, -2, 12]]) 7b = np.array([[1, 2, 3, 4, ], [8, 0, 10, 22], [5, 6, 7, 0], [-1, 0, 10, -12]]) 8 9# 以下は計算可能だが、aとbの全配列組み合わせで実施したい(a[0]〜a[3]×b[0]〜b[3]のイメージ) 10calc(a[0], b[1])

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ppaul

2020/12/04 09:37

なぜ、for文をふたつ回さずに実行したいのですか。 他の書き方を使っても、性能的に早くなることはありません。 性能以外の原因があるのでしょうか?
MagMag

2020/12/04 10:22 編集

ありがとうございます。センサーからあがってくるデータに対して、この計算をリアルタイムで逐次処理しなければならないため、性能が必要です。 以下のリンクにあるように、for文を使わないと早いという文言を見て「for文使わない方がいいだろうな」と考え、meshgirdでの実装を考えていました。ご指摘のとおり、他の方法で早くならなければ、目的は達成できません。 https://sekailab.com/wp/2018/06/11/numpy-combinatorial-calculation-in-array/ >他の書き方を使っても、性能的に早くなることはありません。 このリンクではfor文を回さず、meshgirdで実行した方が早いとありますが、そうならない、ということでしょうか?for文で処理せず、numpyで可能な限り一括計算に持ち込んで処理することで、処理性能は向上するものばかりと思っていましたが、、、。
ppaul

2020/12/04 12:17

pythonのfor文が非常に遅いのは間違いありません。長さ4の二重ループを使うと、イテレータの呼び出しが25回、割り込みが5回起こるので、それだけでも膨大な時間がかかります。 これを回避するために、多次元配列の計算部分をC言語やアセンブラで書かれた高速なライブラリを呼び出すのがnumpyの役目です。 meshgridが使えるのであれば良いのですが、meshgridを使うのはほぼ確実に無理です。calc関数自体を変更せずにほかの制御方法を使った場合には性能は変わりません。 meg_の回答のように、calc関数をnumpyを使って書き直すのはかなり良い方法です。明示的な関数呼び出しだけでなく、**演算や/演算もC言語やアセンブラで書かれた関数の呼び出しになるので、かなりの高速化が期待できます。 性能が不足する場合は、numpyにリンクされているblasライブラリを有償のものに取り換えると、SIMD命令を有効利用することで性能が上がります。 それでも性能が不足するようでしたら、calc関数をpythonインタフェースを使ったC言語で作ることになりますが、ご自身で行うことはお勧めしません。
MagMag

2020/12/06 22:31

承知しました。ありがとうございます!
guest

回答3

0

ベストアンサー

次元を意識してブロードキャストさせていきましょう。
またそのためにsum()ではなくnp.sum()を用いましょう。

python

1In [11]: a = np.array([[0, 0, 0, 0, ], [5, 5, 5, 10], [1, 2, 10, 12], [-3, 0, -2, 12]]) 2 : b = np.array([[1, 2, 3, 4, ], [8, 0, 10, 22], [5, 6, 7, 0], [-1, 0, 10, -12]]) 3 4In [12]: x = a[:, None] 5 : y = b[None, :] 6 7In [13]: 1 - np.sum((x - y) ** 2, -1) / np.sum((x - y.mean(-1, keepdims=True)) ** 2, -1) 8Out[13]: 9array([[-2.00000000e-01, -6.20000000e-01, -3.58024691e-01, -1.07888889e+02], 10 [ 1.33333333e-01, -1.70666667e+00, -2.38709677e+00, -1.65424913e+00], 11 [ 2.41610738e-01, -2.68456376e-02, -7.61904762e-01, -1.02251082e+00], 12 [ 2.58503401e-01, 1.24700240e-01, -8.57142857e-01, -3.26509573e+00]])

投稿2020/12/04 16:58

kirara0048

総合スコア1399

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

MagMag

2020/12/05 00:22 編集

ありがとうございました!ただ、すみません。ブロードキャストで3次元にして計算するというのが、自分の実力不足でまだ理解できないです、、。
meg_

2020/12/05 01:31

こんなにシンプルに書けるんですね!
MagMag

2020/12/06 22:30

どれをベストアンサーにするのか迷ったのですが、一番高評価だったkiraraさんの案にさせていただきました。
kirara0048

2020/12/07 07:31

aのどの次元とbのどの次元が組み合わさるか、絵を描いてみるなどすると感覚がつかめるかもしれません(難しければ次元や要素数を減らして試行)。
MagMag

2020/12/07 07:39

わざわざアドバイスもいだたき、ありがとうございます!やってみます。
guest

0

python

1import numpy as np 2 3def calc(x,y): 4 X = np.tile(x, (1, y.shape[0])).reshape(-1, x.shape[1]) 5 Y = np.tile(y, (x.shape[0], 1)) 6 return 1- np.sum((X - Y) ** 2, axis=1) / np.sum((X - (np.mean(Y, axis=1)).reshape(np.mean(Y, axis=1).shape[0],-1)) ** 2, axis=1)

投稿2020/12/04 10:57

meg_

総合スコア10739

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

MagMag

2020/12/05 00:18

なるほど。tileを使って中で組み合わせを作ってあげるのですね。ありがとうございました!
guest

0

itertools.productを使ってみてはどうでしょうか。

from itertools import product import pandas as pd import numpy as np def calc(x,y): return 1 - sum((x - y) ** 2) / sum((x - y.mean()) ** 2) a = np.array([[0, 0, 0, 0, ], [5, 5, 5, 10], [1, 2, 10, 12], [-3, 0, -2, 12]]) b = np.array([[1, 2, 3, 4, ], [8, 0, 10, 22], [5, 6, 7, 0], [-1, 0, 10, -12]]) result = map(lambda p:calc(*p), product(a, b)) print(list(result))

投稿2020/12/04 09:07

編集2020/12/04 09:13
sfdust

総合スコア1137

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

MagMag

2020/12/05 00:10

なるほど、itertoolを使う方法はわかりやすいですね。ありがとうございます。
sfdust

2020/12/05 01:42

自分の回答は速度のことを全く考慮していないので、あまり参考にはなりません。 計算を走らせた時点で、内部的には2重forを回すのと同じ操作が発生するため激遅です。 現時点ではkirara0048さん、meg_さんのコードが圧倒的に速いと思います。
MagMag

2020/12/06 22:31

わざわざ補足いただき、ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問