質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

3回答

4083閲覧

csvファイルのTRUE, FALSEの文字列を数字1, 0に変換したい

MOSMOS2

総合スコア20

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2019/01/22 09:17

csvファイルが数百MBあり、開くことができないので、下記のように、pythonで一気に文字列を数字に置換したいと考えています。
TRUE --> 1
FALSE --> 0
列は固定されておらず、上記の文字列が点在している可能性があります。

import pandas as pd #import numpy as np # データ読み込み df = pd.read_csv("test.csv", index_col=0) df2 = df.map({'FALSE':0, 'TRUE':1})

下記のようなエラーが出ます。
AttributeError: 'DataFrame' object has no attribute 'map'
解決策について、ご教示いただければ幸いです。
よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

高速に処理したいなら

(df=='TRUE').astype(int)

という方法もあります

投稿2019/01/22 12:18

magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hayataka2049

2019/01/22 14:06

この場合、TRUEとFALSE以外の文字列があると駄目ですかね
magichan

2019/01/22 14:42

はい、そうです。2値限定です。
MOSMOS2

2019/01/22 15:13

そうですね。確かにTRUE, FALSE以外の文字が含まれている可能性もあります。ですが大変参考になります。
guest

0

Pythonなど不要。そう、シェル芸ならね!

bash

1$ cat test.csv|sed 's/TRUE/1/g;s/FALSE/0/g' > new.csv

投稿2019/01/22 10:54

hichon

総合スコア5737

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

MOSMOS2

2019/01/22 15:14

なるほどですね。ありがとうございます。
guest

0

ベストアンサー

エラーメッセージの通り,DataFrameにはmapメソッドは存在しません。applyメソッドを使う方法などもありますが、今回はreplaceメソッドで用を達するでしょう。

python

1df.replace({'FALSE':0, 'TRUE':1})

参考:
pandas.DataFrame, Seriesの要素の値を置換するreplace | note.nkmk.me


実際問題としてはDataFrameに変換して処理するのはさほど高速な方法ではない可能性が高いので、遅すぎるなら他の方法を検討した方が良いです。

  • シェル芸などで頑張る
  • 単にまるごと文字列としてreadして正規表現などで置換

では駄目ですか?

投稿2019/01/22 09:26

hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

MOSMOS2

2019/01/22 15:18

Pythonでずっと工程を流していくので、dataframeにこだわりましたが、読み込みが遅いので、シェルをかましてもよかったかもしれません。甲乙つけがたかったですが、即回答いただいたことと、シンプルで一発でできたので、こちらをベストアンサーにさせていただきました。ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問