質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.51%

pandasでソートが上手くいかない

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 1,695

Tatsuo_Iriyama

score 48

現状

pandasを使用して、csvを読み込み、ある項目でソートをして、再度csvに落としたいと考えています。

現状sort_valuesを使用し、ascending=Falseで降順で並び替えようと思い、試しにスクリプトを実行して出力結果を確認すると、

0        999 users
1        998 users
2        997 users
3        996 users
4        996 users
5        996 users
6        995 users
7        994 users
8        993 users
9        993 users
10       991 users
11       991 users
12       990 users
13       990 users
14       988 users
           ...    
1930    1018 users
1931    1018 users
1932    1018 users
1933    1017 users
1934    1017 users
1935    1016 users
1936    1016 users
1937    1015 users
1938    1015 users
1939    1015 users
1940    1014 users
1941    1014 users
1942    1012 users
1943    1012 users

このような形で出力されました。
※左はインデックス番号で、右が本来大きい順(降順)で並んで欲しい項目の値になります

記載コードはこちらです。

import pandas as pd

csv = pd.read_csv("hogecsv").sort_values(['hoge'], ascending=False).reset_index(drop=True)
print(csv['hoge'])
exit()

理想は、

1    1018 users
2    1018 users
3    1018 users
4    1017 users
5    1017 users
6    1016 users
7    1016 users
8    1015 users
9    1015 users
10    1015 users
11    1014 users
12    1014 users
13    1012 users
14    1012 users
           ...    
1930       998 users
1931       997 users
1932       996 users
1933       996 users
1934       996 users
1935       995 users
1936       994 users
1937       993 users
1938       993 users
1939       991 users
1940       991 users
1941       990 users
1942       990 users
1943       988 users


このような形です。

疑問点

  • どうすれば理想の形に持って行く事が出来るのでしょうか?

ご回答よろしくお願い致します。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • hayataka2049

    2018/10/30 15:55

    ダミーデータで良いので10行くらいのcsvファイルを掲載してください

    キャンセル

回答 1

checkベストアンサー

+2

原因はhoge列が文字列としてソートされているためだと思われます。
もっと簡潔な方法があるかもしれませんが、hoge列から数値を抽出し、その数値でソートします。

import pandas as pd
df = pd.DataFrame( {'hoge':['1 users','9 users', '10 users']})        # テストデータ
df['users'] = pd.to_numeric( df['hoge'].str.replace('users',''))      # 文字列'10 users' を数値10に。
df = df.sort_values(['users'], ascending=False).reset_index(drop=True)# 数値usersで降順ソート
df = df['hoge'] # 不要なusers列を除去
print(df)
"""
0    10 users
1     9 users
2     1 users
Name: hoge, dtype: object
"""

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/10/30 21:15

    ご回答ありがとうございます。
    無事解決しました!

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.51%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる