pandas データフレームの行のソートの方法。最初の条件でソートした後、最初のソートの条件を保って、次の条件でソートする方法を教えていただきたいです。

Question

### 前提
表題の質問が分かりにくいかと思いますが、申し訳ありません。
pandas データフレームの行のソートで、最初の条件でソートした後、最初のソートの条件を保って、次の条件でソートする方法を教えていただきたいです。

### 該当のソースコード

```python
下記dfを、df2のように、col2、col3、col4に「X」があるものを上になるようにソートしました。

df = pd.DataFrame([['A',2,'X',1],['A',2,1,1],['C','X',1,1],['B','X',1,1],['C',6,1,1],['C',1,'X',1],['B',1,1,'X']], columns=['col1','col2','col3','col4'])

col1  col2   col3   col4
0   A     2      X      1
1   A     2      1      1
2   C     X      1      1
3   B     X      1      1
4   C     6      1      1
5   C     1      X      1
6   B     1      1      X

上記を下のようにしてソート（Xを含む行を上になるようにするため）
id_df = df.apply(lambda x: ~x.str.contains('X').any(), axis=1).argsort()
df2 = df.iloc[id_df].reset_index(drop=True)

col1   col2   col3   col4
0   A      2      X       1
1   C      X      1       1
2   B      X      1       1
3   C      1      X       1
4   B      1      1       X
5   A      2      1       1
6   C      6      1       1

上記の後で、下記のように、col2、col3、col4に「X」があるものを上になるようにソートを残して、
col1　で再度ソートしたいです。

col1   col2   col3   col4
0   A      2      X       1
1   B      X      1       1
2   B      1      1       X
3   C      X      1       1
4   C      1      X       1
5   A      2      1       1
6   C      6      1       1

```
### 試したこと

sort_values()はいろいろ試しましたが、ダメでした。
良い方法を知っているかたがおられましたら教えてください。

Accepted Answer

```python
grp = df.loc[:, 'col2':'col4'].apply(lambda x: ~x.str.contains('X').any(), axis=1)
df2 = df.groupby(grp, group_keys=False).apply(pd.DataFrame.sort_values, by='col1').reset_index(drop=True)
print(df2)
```

|    | col1   | col2   | col3   | col4   |
|---:|:------:|:------:|:------:|:------:|
|  0 | A      | 2      | X      | 1      |
|  1 | B      | X      | 1      | 1      |
|  2 | B      | 1      | 1      | X      |
|  3 | C      | X      | 1      | 1      |
|  4 | C      | 1      | X      | 1      |
|  5 | A      | 2      | 1      | 1      |
|  6 | C      | 6      | 1      | 1      |

Answer

Xを含む、含まないという情報(True/False)の列を追加して、その列とcol1とを一緒に sort_values() するとできます。
```python
df2 = (df.assign(containX=df.apply(lambda s: s.str.contains('X')).any(axis=1))
         .sort_values(['containX', 'col1'], ascending=[False, True])
         .drop(columns='containX')
         .reset_index(drop=True))
```

もしくは、先にcol1でソートしておいてから、それをXありなしでソートするのでもできます。
(優先度の高いものほど、あとからソートすることになります)
そのときあとからするソートはstable(同じ値の場合は元の順序を保持する)なものにしないといけません。
```python
df2 = df.sort_values('col1').reset_index(drop=True)

id_df = df2.apply(lambda x: ~x.str.contains('X').any(), axis=1).argsort(kind='stable')
df2 = df2.iloc[id_df].reset_index(drop=True)
```

Answer

xが入ってる行だけでdf抽出してそこでソートするとかですかね…
スマートではないかもしれませんが

前提

該当のソースコード

試したこと

関連した質問