#追記
uidは正しく抽出されましたがtime4が正しく降順になっておりませんでした。
具体的にはtime4をご覧ください。
8月7日はきれいに降順になっているようにみえるのですが下から5行は
8月13日
8月22日
8月1日
8月11日
と降順ではなくランダム?に並んでしまいます。time3はややこしいので消してます。
※最終行を1行追加し合計したから5行の挙動が降順となりません
csv_imported = csv_imported[csv_imported['uid'] == 'idsample'].sort_values('time4', ascending=False)
uid | 2 | time3 | time4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|
idsample | あ | - | Wed Aug 07 2019 16:38:47 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Wed Aug 07 2019 16:38:21 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Wed Aug 07 2019 16:37:53 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Wed Aug 07 2019 16:37:42 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Wed Aug 07 2019 16:37:24 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Wed Aug 07 2019 16:37:13 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Wed Aug 07 2019 16:36:47 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Wed Aug 07 2019 16:36:41 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Tue Aug 13 2019 20:58:05 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Thu Aug 22 2019 21:21:51 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Thu Aug 01 2019 00:35:57 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Sun Aug 11 2019 13:51:33 GMT+0900 (JST) | い | う | え |
idsample | あ | - | Sat Aug 17 2019 12:43:54 GMT+0900 (JST) | い | う | え |
pandas初心者です。2つ実現できないことがあります。よろしくお願いいたします。
#以下対象データ 現状
uid | 2 | time3 | time4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|
idhoge | あ | 2019/8/1 0:35 | Thu Aug 01 2019 00:35:57 GMT+0900 (JST) | い | う | え |
idhoge | あ | 2019/8/1 0:36 | Thu Aug 01 2019 00:36:57 GMT+0900 (JST) | い | う | え |
idsample | あ | 2019/8/1 0:37 | Thu Aug 01 2019 00:37:57 GMT+0900 (JST) | い | う | え |
idsample | あ | 2019/8/1 0:38 | Thu Aug 01 2019 00:38:57 GMT+0900 (JST) | い | う | え |
idsample | あ | 2019/8/1 0:39 | Thu Aug 01 2019 00:39:57 GMT+0900 (JST) | い | う | え |
time3とtime4にはソートしやすい表記があるのかもしれないと思いそれぞれ異なる時間表記を調べて設定してみました。
例)以下例のように2つ表記があります。
2019/8/1 0:35
Thu Aug 01 2019 00:35:57 GMT+0900 (JST)
データを確認頂きましたのでやりたいことについて説明させて頂きます。
#やりたいこと1:time3、またはtime4いずれかの項目を用いて降順して
#やりたいこと2:そのうえで特定のuidのみを抽出したデータをprintしたい
#具体的に実現したいデータ 上記1と2を実施して今回実現目標となる抽出結果データ
要件
timeはtime3またはtime4いずれかの降順を指定
uidはidsampleのみを抽出とします。
uid | 2 | time3 | time4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|
idsample | あ | 2019/8/1 0:39 | Thu Aug 01 2019 00:39:57 GMT+0900 (JST) | い | う | え |
idsample | あ | 2019/8/1 0:38 | Thu Aug 01 2019 00:38:57 GMT+0900 (JST) | い | う | え |
idsample | あ | 2019/8/1 0:37 | Thu Aug 01 2019 00:37:57 GMT+0900 (JST) | い | う | え |
このように「idsampleだけ抽出されて」「timeがソート降順になるように」以下コードを書きかえたいです。
#現状コード
import pandas as pd # headerdef csvheader = ["uid", "2", "time3", "time4", "5", "6", "7"] # read csv from web csv_imported = pd.read_csv("hogeeeen.com", names=csvheader) # time sort csv_importe.sort_values(by=["time4"], ascending=False) # csv_imported = sort(csv_imported.time3) # This now sorts in date order # csv_imported = sort(csv_imported.time4) # This now sorts in date order # user extraction targetuid = 'idsample' csv_imported[csv_imported['uid'] = targetuid]) print(csv_imported)
拙いソースですがよろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー