質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
Python 2.7

Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

解決済

pandas データソートと特定項目データを抽出し結果をprintしたい

削除済ユーザー
削除済ユーザー

総合スコア0

Python 2.7

Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

2回答

0評価

0クリップ

871閲覧

投稿2019/08/22 11:29

編集2022/01/12 10:58

#追記

uidは正しく抽出されましたがtime4が正しく降順になっておりませんでした。
具体的にはtime4をご覧ください。
8月7日はきれいに降順になっているようにみえるのですが下から4行は
8月13日
8月22日
8月1日
8月11日
と降順ではなくランダム?に並んでしまいます。time3はややこしいので消してます。

csv_imported = csv_imported[csv_imported['uid'] == 'idsample'].sort_values('time4', ascending=False)
uid2time3time4567
idsample-Wed Aug 07 2019 16:38:47 GMT+0900 (JST)
idsample-Wed Aug 07 2019 16:38:21 GMT+0900 (JST)
idsample-Wed Aug 07 2019 16:37:53 GMT+0900 (JST)
idsample-Wed Aug 07 2019 16:37:42 GMT+0900 (JST)
idsample-Wed Aug 07 2019 16:37:24 GMT+0900 (JST)
idsample-Wed Aug 07 2019 16:37:13 GMT+0900 (JST)
idsample-Wed Aug 07 2019 16:36:47 GMT+0900 (JST)
idsample-Wed Aug 07 2019 16:36:41 GMT+0900 (JST)
idsample-Tue Aug 13 2019 20:58:05 GMT+0900 (JST)
idsample-Thu Aug 22 2019 21:21:51 GMT+0900 (JST)
idsample-Thu Aug 01 2019 00:35:57 GMT+0900 (JST)
idsample-Sun Aug 11 2019 13:51:33 GMT+0900 (JST)
idsample-Sat Aug 17 2019 12:43:54 GMT+0900 (JST)

pandas初心者です。2つ実現できないことがあります。よろしくお願いいたします。

#以下対象データ 現状

uid2time3time4567
idhoge2019/8/1 0:35Thu Aug 01 2019 00:35:57 GMT+0900 (JST)
idhoge2019/8/1 0:36Thu Aug 01 2019 00:36:57 GMT+0900 (JST)
idsample2019/8/1 0:37Thu Aug 01 2019 00:37:57 GMT+0900 (JST)
idsample2019/8/1 0:38Thu Aug 01 2019 00:38:57 GMT+0900 (JST)
idsample2019/8/1 0:39Thu Aug 01 2019 00:39:57 GMT+0900 (JST)

time3とtime4にはソートしやすい表記があるのかもしれないと思いそれぞれ異なる時間表記を調べて設定してみました。
例)以下例のように2つ表記があります。
2019/8/1 0:35
Thu Aug 01 2019 00:35:57 GMT+0900 (JST)

データを確認頂きましたのでやりたいことについて説明させて頂きます。

#やりたいこと1:time3、またはtime4いずれかの項目を用いて降順して
#やりたいこと2:そのうえで特定のuidのみを抽出したデータをprintしたい

#具体的に実現したいデータ 上記1と2を実施して今回実現目標となる抽出結果データ

要件
timeはtime3またはtime4いずれかの降順を指定
uidはidsampleのみを抽出とします。

uid2time3time4567
idsample2019/8/1 0:39Thu Aug 01 2019 00:39:57 GMT+0900 (JST)
idsample2019/8/1 0:38Thu Aug 01 2019 00:38:57 GMT+0900 (JST)
idsample2019/8/1 0:37Thu Aug 01 2019 00:37:57 GMT+0900 (JST)

このように「idsampleだけ抽出されて」「timeがソート降順になるように」以下コードを書きかえたいです。

#現状コード

import pandas as pd # headerdef csvheader = ["uid", "2", "time3", "time4", "5", "6", "7"] # read csv from web csv_imported = pd.read_csv("hogeeeen.com", names=csvheader) # time sort   csv_importe.sort_values(by=["time4"], ascending=False) # csv_imported = sort(csv_imported.time3) # This now sorts in date order # csv_imported = sort(csv_imported.time4) # This now sorts in date order # user extraction targetuid = 'idsample' csv_imported[csv_imported['uid'] = targetuid]) print(csv_imported)

拙いソースですがよろしくお願いいたします。

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Python 2.7

Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。