###前提・実現したいこと
Pythonであるwebサイトの特定の数字の変化を時系列で保存したいです。
取得した時刻と数字を取り込み、csvファイルに出力しました。
これを例えば1日1回0:00に結果を追加したいと考えています。
(cronの設定まではまだたどり着いてません)
日付 個数
2017-10-23 12:15:00 5000
2017-10-24 12:15:00 4999
2017-10-25 12:15:00 4975
・・・
といった形で実行する度に
実行日時と個数が行追加されるのが理想です。
取得した段階でcsvに出力し、
次に実行する際、csvを読み込んで
新しい結果を追加しようとしたところ、
毎回1行ずつUnnamedな列が追加されてしまいます。
###発生している問題・エラーメッセージ
Unnamed: 0 個数 日付 0 0.0 5000 2017-10-23 12:15:00.000000 1 1.0 4999 2017-10-23 12:15:00.000000 0 NaN 4810 2017-11-01 05:42:00.387017
###該当のソースコード
import requests from bs4 import BeautifulSoup r=requests.get("https://hoge/") c=r.content soup=BeautifulSoup(c,"html.parser") op=soup.find_all('option')[0]['data-stocks'] print (op) import datetime now = datetime.datetime.now() print(now) import pandas as pd import numpy as np #データフレームdfの呼び出し df = pd.read_csv("hoge.csv", encoding="shift_jis") df #現在の数を追加 df2 = pd.DataFrame([[now, op]], columns=['日付','個数']) df2 #2つを結合 df.append(df2) df.to_csv("hoge.csv")
###補足情報(言語/FW/ツール等のバージョンなど)
Jupyter notebook
python
beautiful soup
pandas
よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。