回答率: 85.30%

質問するログイン新規登録

トップ多次元配列に関する質問 python 二次元データソート

編集履歴

回答編集履歴

1

コメントに対して追加回答

2021/09/30 10:08

投稿

スコア24672

answer CHANGED Viewed

@@ -24,4 +24,54 @@
 [0.3, 0.4, 0.6, 0.7, 0.8, 2, 2.1, 2.3, 3.4, 4.4]
 >>> print(result2)
 [[1], [0, 3], [1], [3], [0], [2], [2], [0], [2], [2]]
-```
+```
+追加回答
+なるべく、機械命令で実行する部分を増やすために、numpyとpandasを使った方法です。
+numpyを使っているため、「0.4という値が0番目(a)・3番目(b)どちらにもあるので，同率ということで[0,3]という書き方」はやっていません。それをやると遅くなります。
+```python
+>>> import numpy as np
+>>> import pandas as pd
+>>>
+>>> a = np.array([0.4, 0.8, 2.3])
+>>> b = np.array([0.3, 0.6])
+>>> c = np.array([2, 2.1, 3.4, 4.4])
+>>> d = np.array([0.4, 0.7])
+>>>
+>>> abcd = [a, b, c, d]
+>>>
+>>> num_elements = sum([len(e) for e in abcd])
+>>> all_array = np.zeros(2 * num_elements).reshape(num_elements, 2)
+>>>
+>>> start = 0
+>>> for i, a in enumerate(abcd):
+...     end = start + len(a)
+...     all_array[start:end, 0] = a
+...     all_array[start:end, 1] = i
+...     start = end
+...
+>>> df = pd.DataFrame(all_array)
+>>> df.sort_values(0, inplace=True)
+>>> print(df)
+      0    1
+3   0.3  1.0
+0   0.4  0.0
+9   0.4  3.0
+4   0.6  1.0
+10  0.7  3.0
+1   0.8  0.0
+5   2.0  2.0
+6   2.1  2.0
+2   2.3  0.0
+7   3.4  2.0
+8   4.4  2.0
+>>> result1 = df[0].values
+>>> result2 = df[1].values.astype(int)
+>>> print(result1)
+[0.3 0.4 0.4 0.6 0.7 0.8 2.  2.1 2.3 3.4 4.4]
+>>> print(result2)
+[1 0 3 1 3 0 2 2 0 2 2]
+```
+最初の回答よりは速いと思います。