質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

3065閲覧

pandasを使ってデータフレーム内の特定の文字列を含む行番号を取得したい。

ita_61279

総合スコア9

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/09/03 06:57

print(list(df.reset_index().query('列名=="aaaa"').index))
をつかって検索をすると
[]
が帰ってきてしまい困っています。
確実に存在している文字列で検索しています。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ita_61279

2021/09/03 07:01

扱っているデータは ✳︎✳︎------aaaa----- ✳︎jmjgtwgg ✳︎✳︎ 1688,546,5453 5561,2436,544 46,5,5 ・ ・ ・ ✳︎✳︎---bbbb-- ✳︎jmjj 5674,5684,546 456,553,456 ・ ・ ・ というのが300万行続いています。
can110

2021/09/03 07:02

「何が」確実に存在しているのでしょうか? また、第三者が実行し現象を再現できるコードを提示ください。
ita_61279

2021/09/03 07:12

コメントありがとうございます。 存在しているのは検索している文字列です。 簡単なデータフレームを作り、同じ方法で実行してみましたが問題なく動作します。 不具合の出ているデータですが、そのまま乗せることのできないデータとなっているため再現可能コードを提示できません。 部分一致で検索することができない。 や、 []が帰ってくる場合の心当たりがありましたら教えていただけないでしょうか?
can110

2021/09/03 07:20

「確実に存在している」のはどのような手段で確認したのかを具体的に記載ください。 ちなみに提示コードでは「部分一致で検索」はできていないように見えます。
ita_61279

2021/09/03 07:27

返信ありがとうございます。 使用データをテキストファイルで開き、ctrl +Fで手動で検索しました。 提示したコードでは列に入っている値全体が一致してなければダメであるということですか?それとも全く見当違いのことをしているということでしょうか。
can110

2021/09/03 07:29

'列名=="aaaa"'なら「aaaaa」は一致しているとはみなされません。
ita_61279

2021/09/03 07:45

理解できました。 勉強が足りず訳のわからない質問をしていました。申し訳ありません。 この検索方法は全て一致するデータの検索を行なっていたのですね。 ✳︎✳︎----aaaa---- という全体で検索したところ意図した値が返されました。 長々とありがとうございました!
guest

回答1

0

ベストアンサー

質問内容がよく分かりませんが、部分一致は以下のようなコードでできます。
参考:SQLのLIKE句を、pandas(python)のqueryメソッドのstr.contains()を使って合致するデータ抽出を行って見た

Python

1import pandas as pd 2 3df = pd.DataFrame({'col':['aaaaa']}) 4l = list(df.reset_index().query('col.str.contains("aaaa")', engine='python').index) 5print(l) # [0]

投稿2021/09/03 07:32

can110

総合スコア38341

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ita_61279

2021/09/03 07:46

理解が足りておらず、申し訳ありませんでした。 部分一致での検索方法の指定も助かります。 ありがとうございます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問