質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

929閲覧

pandasの条件抽出がうまくいかない

taro_yamada

総合スコア55

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2020/10/31 04:13

以下の文で2020-10-23の日付の7779の銘柄のtrading_unitを引き出したいと思っていますが、tがemptyとなってしまいます。
うまく拾う方法はありますでしょうか。

python

1symbol = 7779 2date = '2020-10-23' 3t = df[(df["symbol"] == str(symbol)) & (df["created_date_at"] == str(date))] 4if not t.empty: 5 return t.iat[0, 1] 6else: 7 return 100

pandas

1 symbol trading_unit created_date_at 2239 7779 100 2020-10-23

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2020/10/31 04:33

dfの各列の型は何ですか?
taro_yamada

2020/10/31 06:12 編集

以下の通りです。失礼しました。 symbol object trading_unit int64 created_date_at object dtype: object
meg_

2020/10/31 09:47

object型となっているものがmixed typeとなっていて「7779」は数値として保持されている、という可能性は有りませんか? 念のためsymbol列をstr型に明示的に変換してみてはどうでしょうか?
taro_yamada

2020/10/31 10:30

megさんのご指摘の通りでした。 created_date_atがstr型でなかったみたいで、seriesを明示的に文字列に変更したところうまく動きました。 ありがとうございました。
guest

回答1

0

ベストアンサー

提示されたpandasのデータ結果において、列名とデータの縦位置がずれているのが気になります。
元データの7779(または2020-10-23)の前後に空白文字が含まれていないでしょうか?

その場合は、以下コードのようにすると正常に抽出できます。
またqueryを使うとシンプルに書けます。

Python

1import pandas as pd 2 3df = pd.DataFrame({'symbol':[' 7779 '], 'trading_unit':[100], 'created_date_at':['2020-10-23']}) 4df['symbol'] = df['symbol'].str.strip() # 前後に空白があれば取り除く 5 6symbol = 7779 7date = '2020-10-23' 8t = df[(df["symbol"] == str(symbol)) & (df["created_date_at"] == str(date))] 9print(t) 10# symbol trading_unit created_date_at 11#0 7779 100 2020-10-23 12 13t = df.query(f'symbol == "{symbol}" and created_date_at == "{date}"') 14print(t) 15# symbol trading_unit created_date_at 16#0 7779 100 2020-10-23

投稿2020/10/31 04:42

編集2020/10/31 06:25
can110

総合スコア38341

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

taro_yamada

2020/10/31 06:12

すみません。しっかり書かなかったのですが、symbolはstrとして保持しています。 データ型は以下の通りです。 symbol object trading_unit int64 created_date_at object dtype: object
can110

2020/10/31 06:20

型について了解しました。回答を修正しました。
taro_yamada

2020/10/31 07:50

やはりうまく動きません。 元の7779も同じDBから取り出してきているので、ずれることはなさそうです。
can110

2020/10/31 08:02

つまり前後に空白文字がついていることはないということでしょうか?
taro_yamada

2020/10/31 09:32

はい。ついていることはないです。 .str.strip() も試しましたがemptyのままでした。
can110

2020/10/31 10:08

なるほど。あとは修正依頼欄でmeg_さんが指摘されている点を確認してみてどうか、でしょうか。
taro_yamada

2020/10/31 10:30

megさんのご指摘の通りでした。 created_date_atがstr型でなかったみたいで、seriesを明示的に文字列に変更したところうまく動きました。 ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問