#やりたいこと
idsample という userIdのみ抽出し
time02 の中の時間を降順で表示したいです。
#できないこと time02が日付時間降順にならない
userIdは正しく抽出されました。しかしtime02が正しく降順にされません。
具体的にはtime02をご覧ください。8月7日はきれいに降順になっているようにみえるのですが下から5行は
8月13日
8月22日
8月1日
8月11日
8月17日
と降順ではなく曜日の頭文字順にTTTSSと並んでしまいます。time01はややこしいので消してます。
これはtime02のデータ型がオブジェクト型である事が問題ではないのかなと皆さんのお力添えでわかりました。
userId | 2 | time01 | time02 | 5 | 6 | 7 |
---|---|---|---|---|---|---|
idsample | あ | - | Wed Aug 07 2019 16:38:47 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Wed Aug 07 2019 16:38:21 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Tue Aug 13 2019 20:58:05 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Thu Aug 22 2019 21:21:51 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Thu Aug 01 2019 00:35:57 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Sun Aug 11 2019 13:51:33 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Sat Aug 17 2019 12:43:54 GMT+0900 (JST) | い | う | え |
#今回実現したい降順
userId | 2 | time01 | time02 | 5 | 6 | 7 |
---|---|---|---|---|---|---|
idsample | あ | - | Thu Aug 22 2019 21:21:51 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Sat Aug 17 2019 12:43:54 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Tue Aug 13 2019 20:58:05 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Sun Aug 11 2019 13:51:33 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Wed Aug 07 2019 16:38:47 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Wed Aug 07 2019 16:38:21 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Thu Aug 01 2019 00:35:57 GMT+0900 (JST) | い | う | え |
そこで以下を実施しました。
#ためしたこと
データ取得方法は以下になります。
# -*- coding: utf-8 -*- import pandas as pd # CSVの最初の行ヘッダーを定義 csvheader = ["userId", "2", "time01", "time02", "5", "6", "7"] # 最新の全データCSV ファイルをgoogle drive urlから読み込む csv_imported = pd.read_csv("https://hoge.com", names=csvheader)
データ型を確認 全てオブジェクト型でした
print(csv_imported.dtypes)
そのためpd.to_datetimeでtime02をデータ型変換しました。datetime64[ns, pytz.FixedOffset(-540)]
csv_imported['time02'] = pd.to_datetime(csv_imported['time02'])
そしてユーザがidsampleのみ抽出し、time02で降順をしました。
csv_imported = csv_imported[csv_imported['userId'] == 'idsample'].sort_values('time02', ascending=False)
すると以下エラーが出ている状況です。
Exception Type: ValueError Exception Value: ('Unknown string format:', 'time02')
宜しくお願いいたします。
>前回の質問ページへのリンク
https://teratail.com/questions/207651
回答1件
あなたの回答
tips
プレビュー