整数値からのみなるデータの集計をdf.mean()メソッドで行っているのですが、なぜか出てくる平均値がネピア数になってしまいます。原因として考えられるのはデータ量が大きすぎることぐらいなのですが、何か他の原因があるのでしょうか。ご回答いただけると幸いです。
どのようなデータを集計しているのですか? .mean()を使わずに四則演算だけで求めた平均値は、どうなるのですか?
詳細についてはお話しできないのですが、数万行×数千列のデータを集計しています。四則演算に関してはまだ行っていません。
ネイピア数になってるというのはどういうことでしょう? 単に少数が指数表記("1.234e5" みたいな形式)で表示されてということはありませんか?
一応確認なのですが、「ネイピア数になる」とは浮動小数点数表示のことではないですよね? 具体的にどういう結果が表示されるかを(多少数値を変えても良いので)追記されたほうがいいかと思われます。
-4.449729e-02のような値が帰ってくる、ということです。
出力に文字"e"が含まれる=ネイピア数 と解釈されているようですね? これは「指数表記」とよばれるもので、数学のネイピア数とは直接的な関係はありません。
「ネイピア数」は自然定数の底( 2.718281828459045235360287471352 …)の事だと思っていたのですが、-4.449729e-02は明らかに別物ですね。「ネイピア数(もしくはネピア数)」が何か説明してください。
出力に文字"e"が含まれる=ネイピア数ということではないのですね。誤解していました。この表記によって表される数の大きさを知りたいのですが、e=2.718281828459045235360287471352 …を代入して計算すれば良いのでしょうか。
「文字"e"が含まれる」=「指数表記で数値が表現されている」です。 問題は『正確に集計できない』というところでしょう? データを少ない個数(例えば100個)の整数から成るグループに分けて、グループでの平均値を求める。グループごとの平均値が求まったら、グループを少ない個数(例えば100個)の平均値から成るグループに分けて、グループでの平均値を求める。1億行x1億列のデータでもグループで平均値を求める作業を8回繰り返せば、平均値が求められます。
-4.449729e-02 は、-0.04449729 と同じ値です。 e-02は、小数点を2桁左に移す(1/100にする)という意味です。 e3は、小数点を3桁右に移す(1000倍にする)という意味です。
回答1件
あなたの回答
tips
プレビュー