こんにちは。
私は飲食店で働いていて、お店のPOSデータがスクレイピングできるようになったので
その日のフードやドリンクの出数などを毎日csvファイルにまとめて後日分析できるようにしたいのですが、
POSデータがその日に売れた商品のみ記録、表にしているため毎日データがばらばらです。
具体的には、
7月11日
バーガーA:10個
バーガーB:12個
ドリンクA:8個
7月12日
バーガーA:9個
バーガーC:3個
ドリンクB:7個
デザートA:1個
といった形です。
その日のデータだけなら、各商品名をヘッダーにして数量をcsvファイルに出力することができるのですが、
後日ヘッダーにない商品が出てきた際にcsvファイルを作り直すもしくは追記する方法としてよい方法が思いつきません。
例えば、
||バーガーA|バーガーB|ドリンクA|
|:--:|:--:|:--:|:--:|
|7月11日|10個|12個|8個|
としていたものを
バーガーA | バーガーB | バーガーC | ドリンクA | ドリンクB | デザートA | |
---|---|---|---|---|---|---|
7月11日 | 10個 | 12個 | 0個 | 8個 | 0個 | 0個 |
7月12日 | 9個 | 0個 | 3個 | 0個 | 7個 | 1個 |
というように拡張してcsvファイルに保存したいです。
理由はこのような形のほうがpandasなどで分析する際にやりやすいと考えているからです。
現状、csvファイルを作る際には、seleniumのwebdriverでスクレイピングしたデータをBeautifulSoupでパースして、テキストデータを辞書型として変数に格納して、ライブラリcsvのDictWriteで書き込んでいます。
既存のライブラリ、サードパーティーのライブラリ含めてよい方法があればご教授願います。
回答4件
あなたの回答
tips
プレビュー