環境:python3,Win10,jupyter
初学者です。表題のような処理をしたいと考えております。
具体的には以下のようなデータフレームに対して
df1
列1 | 列2 | 列3 |
---|---|---|
まいう | 1 | 0 |
えほあ | 1 | 0 |
いさえ | 2 | 0 |
おあい | 8 | 9 |
… | … | … |
(実際にはかなり長く、全部見ることができません。)
以下のような処理をしたところ、
Python3
1#上の成果物から列1に「う」がふくまれるものだけ読み込む。 2contain = df1[df1["列1"].str.contains("う")]
以下のようなエラーを得ました。
ValueError Traceback (most recent call last) <ipython-input-114-61dba3eb4c39> in <module>() (中略) ~\Anaconda3\lib\site-packages\pandas\core\frame.py in __getitem__(self, key) 1956 if isinstance(key, (Series, np.ndarray, Index, list)): 1957 # either boolean or fancy integer index -> 1958 return self._getitem_array(key) 1959 elif isinstance(key, DataFrame): 1960 return self._getitem_frame(key) ~\Anaconda3\lib\site-packages\pandas\core\frame.py in _getitem_array(self, key) 1983 def _getitem_array(self, key): 1984 # also raises Exception if object array with NA values -> 1985 if com.is_bool_indexer(key): 1986 # warning here just in case -- previously __setitem__ was 1987 # reindexing but __getitem__ was not; it seems more reasonable to ~\Anaconda3\lib\site-packages\pandas\core\common.py in is_bool_indexer(key) 187 if not lib.is_bool_array(key): 188 if isnull(key).any(): --> 189 raise ValueError('cannot index with vector containing ' 190 'NA / NaN values') 191 return False ValueError: cannot index with vector containing NA / NaN values
以下のサイトで述べられていることが解決策に近いかと思いますが、いまいちここから何をしたらよいのかわかりません。教えて下さると幸いです。
https://stackoverflow.com/questions/28311655/ignoring-nans-with-str-contains
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/01/11 08:18