質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.92%

numpy配列の文字列要素を条件でしぼる(np.frompyfuncでの実装)

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 156

_nobu_

score 27

開発環境

Jupyter notebook (python3)

やりたかったこと

numpy配列の要素が数字の場合は指定した条件に一致するかをnumpy.bool_型の配列で返してくれるが,文字列だとうまく反応しないのでfrompyfuncを使って実装しようとした.

(リスト内包表記で実装できるのは理解しています)

数字の場合

a= np.array([0,1,2,3,4])
print((a > 2))
print(a[(a > 2)])


<出力>

[False False False  True  True]
[3 4]

要素ごとに条件に一致しているか確認してくれている.

文字列の場合

a= np.array(['0L','1L','2T','3T','4L'])
print('L' in a)


<出力>

False

要素ごとではなくnumpy配列全体に対して条件を確認してしまっている.これだとa[('L' in a)]としても上手くいかない.

frompyfuncでの実装

A = np.array(['0L','1L','2T','3T','4L'])

def __in(x,y):
    return (x in y)

b = np.array([True,True,False,False,True])
c = [True,True,False,False,True]
d = np.frompyfunc(__in, 2,1)('L',A)

print(type(b))
print(type(b[0]))
print(b)
print(A[b])

print(type(c))
print(type(c[0]))
print(c)
print(A[c])

print(type(d))
print(type(d[0]))
print(d)
print(A[d])

<出力>

<class 'numpy.ndarray'>
<class 'numpy.bool_'>
[ True  True False False  True]
['0L' '1L' '4L']

<class 'list'>
<class 'bool'>
[True, True, False, False, True]
['0L' '1L' '4L']

<class 'numpy.ndarray'>
<class 'bool'>
[True True False False True]
---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
<ipython-input-318-4e8bb2be31b9> in <module>()
     21 print(type(d[0]))
     22 print(d)
---> 23 print(A[d])

IndexError: arrays used as indices must be of integer (or boolean) type

numpy配列と通常のリストは上手くいってますが,np.frompyfuncのみエラーをはいています.

また,int型かbool型を使えとありますが出力の通り各要素はbool型になっています.

list(np.frompyfunc(__in, 2,1)('L',A))のようにリストに変換してからだと上手くいくのですがこの場合何が問題なのでしょうか.

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • bsdfan

    2020/07/21 08:33

    質問への直接の回答とは違いますが、文字列の含まれた要素を探すには、numpy.char.find
    https://numpy.org/doc/stable/reference/generated/numpy.char.find.html
    を使うのが簡単です。

    キャンセル

  • _nobu_

    2020/07/21 08:56

    おお,便利ですね!
    ただboolで返してはくれないので今回の場合だと少し手間ですかね?

    キャンセル

  • bsdfan

    2020/07/21 09:01

    np.char.find(A, 'L') >= 0 するだけなので、それほどの手間でもないと思います。

    キャンセル

  • _nobu_

    2020/07/21 09:23

    あ,np.char.findがnumpy配列で返ってくるからそのまま条件文にできますね.
    こっちの方がスマートですね.ありがとうございます!

    キャンセル

回答 1

checkベストアンサー

+1

面白い。下だと動きますねえ。
元のコードだとd.dtypeすると'bool'でなく'O'と出るので、そのせいでしょうか。

import numpy as np
A = np.array(['0L','1L','2T','3T','4L'])

def __in(x,y):
    return (x in y)

b = np.array([True,True,False,False,True])
c = [True,True,False,False,True]
d = np.frompyfunc(__in, 2,1)('L',A).astype(bool) # astype付与

print(type(b))
print(type(b[0]))
print(b)
print(A[b])

print(type(c))
print(type(c[0]))
print(c)
print(A[c])

print(type(d))
print(type(d[0]))
print(d)
print(A[d])

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/07/21 08:38

    リファレンス(https://numpy.org/doc/stable/reference/generated/numpy.frompyfunc.html)を読むと、
    > Notes
    > The returned ufunc always returns PyObject arrays.
    とあるので、そういう仕様みたいです(知らなかった)

    キャンセル

  • 2020/07/21 08:59

    手元の環境でも実行できました.
    dtypeがboolかintでないと反応しないということなんですかね.
    回答ありがとうございます!

    キャンセル

  • 2020/07/21 09:36

    >bsdfanさん
    ご確認ありがとうございます。そういえばドキュメントあたってませんでした。

    >_nobuさん
    解決したようで良かったです。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.92%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る