pythonにてpandasを使って計測された200万行程のデータの入ったCSVを読み込み、
その平均をとるようなコードを書いているのですがいくつか分からない点があり、質問させてください。
下記のようなコードを書いて実行した所、パターン1の実行結果のように、ヘッダーやデータタイプなどの情報が付いてきてしまいました。
計算結果が欲しいだけなので、回避方法を調べるとブログサイトで下記のパターン2ようにdf=df.iloc[-1]方法を紹介しておりました。
試したところ確かに、値だけの出力は可能でしたが、丸め込まれたのか計算値が異なっていました。
1.数値だけを得られる方法で他の方法はないでしょうか?
2.同じfloat64bit型なのに値が違うのはなぜでしょうか?
(最初のパターンの計算にはデータとして文字列が入っているためでしょうか?)
上記の2点について解決策とそうなってしまう理由も教えていただけると幸いです。
パターン1
df= pd.read_csv(work_files,encoding='shift-jis',usecols=['Anum'],engine='python')
num = df.mean()
print(num)
#実行結果
Anum 26.402333
dtype: float64
パターン2
df= pd.read_csv(work_files,encoding='shift-jis',usecols=['Anum'],engine='python')
num = df.mean()
print(num)
print(type(num))
df=df.iloc[-1]
print(num)
print(type(num))
#実行結果
Anum 26.402333
dtype: float64
<class 'pandas.core.series.Series'>
26.5
<class 'numpy.float64'>
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2022/05/16 02:15