前提・実現したいこと
以下のような、時間ごとに全体の傾向としては増加する物の数を数えたCSVデータがあります。この場合、異常値である23を除けば上手な回帰直線が描けそうですが、csv形式のデータをpythonでそのような処理をするやり方がわかりません。前の時間との差分が一定の値以上であればその列を削除すれば良いかと思いましたが、それもできませんでした。ご教授宜しくお願い致します。
time count
00:00 1
00:01 3
00:02 5
00:03 2
00:04 23
00:05 7
00:06 5
00:07 8
:
:
・タグが「Python2.7」ですが2.7限定でしょうか?
・「前の時間との差分が一定の値以上であればその列を削除すれば良いかと思いましたが、それもできませんでした。」とありますが、試したコードとその結果を質問に追記してください。
> 前の時間との差分が一定の値以上であればその列を削除すれば良いかと思いましたが、それもできませんでした。
できなかったというのはやり方がわからなかったということですか?
質問ありがとうございます。返信が遅れて申し訳ありません。
・python2.7限定か?
→このような言葉が適切かはわかりませんが、python2.7である程度構築されたシステムがあってそこで実現したいことなので、2.7に限定させて下さい
・できなかったことを具体的に
→すみませんこれについてはどうすれば良いか分からなかったため具体的な作業はしておりません。例えばhoge..iat[0,0]で要素を指定して、特定の行の値全てからその要素の値を引くなどはできるのですが、前後の行間の差をとるやり方は分かりませんでした。
> 前後の行間の差をとるやり方
pandasを使っているなら、diff()はどうでしょうか?
python2.7は使わないので試してはいません。
ああ!!できました!1ありがとうございます!!
あなたの回答
tips
プレビュー