質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

572閲覧

DataFrameの条件に基づいてデータを抽出したい

umeeeeeeeeee

総合スコア1

Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2020/05/14 07:00

■概要
表の列1を参照して、列2のデータを取り出したい。
表は以下のような特徴があります。
・列1にはデータ番号が各2個ずつ若い順に並んでいる。
・カラムはなし。

列1列2
110
18
412
414

■実現したいこと
取り出したいデータ番号の2番目の行の値を取り出したい。
(例)
データ番号1 → 8
データ番号4 → 14

python初心者で、質問内容に不足があるかもしれませんが、
ご教授の方よろしくお願いいたします。

発生している問題・エラーメッセージ

int() argument must be a string, a bytes-like object or a number, not 'Int64Index'

該当のソースコード

Python

1import pandas as pd 2import numpy as np 3#データインポート 4csv_input = pd.read_csv(file,encoding="cp932") 5#取り出したいデータ番号指定 6number = 4 7#列1において、numberと同じ値の行のみを抽出 8n = csv_input.iloc[:,2] == number 9m = n[n == True] 10#numberと同じ値の行の2個目をindexに格納 11index = int(m.index[2:3]) 12#ほしいデータをdataに格納 13data = csv_input.iat[index,1]

補足情報(FW/ツールのバージョンなど)

anaconda3
Python3.7

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2020/05/14 07:10

エラー発生行は「index = int(m.index[2:3])」ですか? エラーメッセージはエラー発生行を含めて掲載してください。(出来ればエラーメッセージ全文)
umeeeeeeeeee

2020/05/14 07:19

その通りです。 ■エラーメッセージ index = int(m.index[2:3]) TypeError: int() argument must be a string, a bytes-like object or a number, not 'Int64Index' これからは気を付けようと思います。 ご指摘ありがとうございます。
guest

回答2

0

ベストアンサー

多分やりたいことは

Python

1index = int(m.index[2:3])

の部分を

Python

1index = m.index[-1]

とすることで実現できると思います。

さらに書くとフィルタリング部(mを導いている行)はnからフィルタリングするのではなく、もとのデータフレームからフィルタリングすることで

Python

1n = csv_input.iloc[:,2] == number 2m = n[n == True] 3index = m.index[-1] 4data = csv_input.iat[index,1]

の部分は

Python

1n = csv_input.iloc[:,2] == number 2data = csv_input[n == True].iat[-1,1]

となります

さらに書くと、groupby().tail() を使うことで一括で対応する行を抜き出すこともできます。

https://pandas.pydata.org/pandas-docs/version/0.17.0/generated/pandas.core.groupby.GroupBy.tail.html

Python

1import pandas as pd 2 3df = pd.DataFrame({ 4 '列1':[1,1,2,2,3,3,4,4,5,5], 5 '列2':[1,2,3,4,5,6,7,8,9,10] 6}) 7 8ret = df.groupby('列1').tail(1) 9print(ret) 10# 列1 列2 11#1 1 2 12#3 2 4 13#5 3 6 14#7 4 8 15#9 5 10

投稿2020/05/14 07:43

magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

umeeeeeeeeee

2020/05/14 08:41

回答ありがとうございます。 無事解決できました。 データ番号の数が3以上でも、好きな箇所を抽出できるので、勉強になりました。 n,mのところは自分でも少しまどろっこしく感じていたので、大変助かります。 groupbyは見たことがあったのですが、このような場面で使えるんですね。 インプットだけではなく、アウトプットにも注力していこうと強く思いました。 また機会がありましたら、回答の方よろしくお願いいたします。
guest

0

一括処理できます

python

1import pandas as pd 2df=pd.DataFrame([[1,10],[1,8],[4,12],[4,14],]) 3df[df.duplicated(subset=0)]

なぜこうなるかは調べてみてください

投稿2020/05/14 07:19

x98000

総合スコア1096

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

umeeeeeeeeee

2020/05/14 08:05

回答ありがとうございます。 "重複要素"として扱うことを全く考えていませんでした。 重複要素の取り扱いについて学ぶことができました。 また機会があれば、回答の方よろしくお願いします。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問