###前提・実現したいこと
失礼致します.表題の件について質問させていただきます.
例えば,こんなCSVファイルがあるとします.
//data.csv NA,な NI,に NU,ぬ NE,ね NO,の
左の列にはローマ字で「NA」「NI」「NU」「NE」「NO」が記入されており,右の列にはひらがなが記入されています.
このCSVファイルを用いてデータフレームを生成してみます.
Python
1import pandas as pd 2import codecs as cd 3 4file = 'data.csv' 5 6with cd.open(file, "r", "cp932", "ignore") as file: 7 df = pd.read_table(file, header=None, sep=',', 8 names=('INDEX', 'VALUE'), 9 dtype={'NAME': 'object', 'VALUE': 'object'},) 10 11print(df)
これを出力すると次のようになります.
//print(df)で出力した結果 INDEX VALUE 0 NaN な 1 NI に 2 NU ぬ 3 NE ね 4 NO の
このように「NA」が「not available」として扱われてしまったためか,「NaN」が代入されてしまいます.
これを変換されることなく出力する方法を教えていただければと思います.
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/11/12 11:01
2017/11/12 11:04 編集