質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

2956閲覧

日本語の文字を含む配列をNaNに置き換える方法

loreeeee

総合スコア40

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2018/07/06 08:34

あるnumpy配列(下のコードのarr)は各要素がstr型で値が入っており,さらに'欠損'という文字列も含んでいます.

やりたいこととしては,arrの'欠損'をNaNに変更し,全要素を実数型に変換したいのです.

素直にarr.astype(np.float32)とやると'ValueError: could not convert string to float: '欠損''と表示されてうまくいきません.また私の環境によりエディタの中で日本語が使えないため,np.where(arr == '欠損')などという処理ができず,欠損の扱いに困っています.どなたか解決法を教えていただけませんか?よろしくお願いします.

↓コード

python

1import numpy as np 2 3arr = np.array(['2.0','14.0','12.11','欠損']) 4float_arr = arr.astype(np.float32) 5print(arr) 6

↓出力結果です

python

1----> 4 float_arr = arr.astype(np.float32) 2 5 print(arr) 3 4ValueError: could not convert string to float: '欠損'

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

こんな感じでどうですか。

python

1import numpy as np 2 3def f(s): 4 try: 5 return np.float32(s) 6 except: 7 return np.nan 8 9f_v = np.vectorize(f) 10arr = f_v(np.array(['2.0','14.0','12.11','欠損'])) 11print(arr.dtype) 12print(arr) 13""" => 14float32 15[ 2. 14. 12.11 nan] 16""" 17

np.vectorizeについては、以下などを参照。

numpy.vectorize — NumPy v1.14 Manual
numpy.vectorizeの使い方

投稿2018/07/06 11:16

hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

loreeeee

2018/07/07 00:53 編集

ありがとうございます。ただ挙動がどうなってるかまだ掴みきれてません...`f_v = np.vectorize(f)`の部分は何をしているのでしょうか?
hayataka2049

2018/07/07 07:32

本来はスカラーに適用されるような関数をベクトル化して、配列を突っ込めるようにしています
loreeeee

2018/07/12 13:42

referenceを読んでなんとか理解できた気がします.回答して頂きありがとうございました.
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問