Python,Pandas:文字列”NA”を含むCSVファイルからデータフレームを作成すると”NaN”になってしまう

###前提・実現したいこと
失礼致します．表題の件について質問させていただきます．

例えば，こんなCSVファイルがあるとします．

//data.csv
NA,な
NI,に
NU,ぬ
NE,ね
NO,の

左の列にはローマ字で「NA」「NI」「NU」「NE」「NO」が記入されており，右の列にはひらがなが記入されています．

このCSVファイルを用いてデータフレームを生成してみます．

Python
1import pandas as pd
2import codecs as cd
3
4file = 'data.csv'
5
6with cd.open(file, "r", "cp932", "ignore") as file:
7    df = pd.read_table(file, header=None, sep=',',
8                           names=('INDEX', 'VALUE'),
9                           dtype={'NAME': 'object', 'VALUE': 'object'},)
10
11print(df)

これを出力すると次のようになります．

//print(df)で出力した結果
  INDEX VALUE
0   NaN     な
1    NI     に
2    NU     ぬ
3    NE     ね
4    NO     の

このように「NA」が「not available」として扱われてしまったためか，「NaN」が代入されてしまいます．
これを変換されることなく出力する方法を教えていただければと思います．

行動規範の内容に同意します

回答2件

ここ

投稿2017/11/12 01:23

WathMorks

総合スコア1582

seemsLike

2017/11/12 11:01

ありがとうございます．

seemsLike

2017/11/12 11:04 編集

誤って2回投稿してしまいました

行動規範の内容に同意します

自己解決

ここのサイトを参考にして，次のように変えてみました

Python
1import pandas as pd
2import codecs as cd
3
4file = 'data.csv'
5
6with cd.open(file, "r", "cp932", "ignore") as file:
7    df = pd.read_table(file, header=None, sep=',',keep_default_na=False,
8                           names=('INDEX', 'VALUE'),
9                           dtype={'NAME': 'object', 'VALUE': 'object'},)
10
11print(df)