pandasを使ったwebスクレイピングで、あるサイトから表をコピーする ということをやりたいです。
とりあえず表自体をコピーし表示することはできましたが、余分なデータを消す方法がわからないので教えていただきたいです。
コード
import pandas as pd
url = 'https://www.nisshokin.com/7908/'
dfs = pd.read_html(url)
dfs[0].columns = ['日付', '買残/売残', '倍率', '逆日歩', '規制']
print(dfs[0][['日付','買残/売残']].head())
ここで、日付の項目に日付が2つ入ってしまうのですが、これをなんとかしたいです。
2018/08/03(金) 08/03(金)
データを取ってきたサイトを見ると
<span class="date-large">2018/08/03(金)</span>
<span class="date-small">08/03(金)</span>
となっているため、下のほうのsmallの方を消したいです
お願いします
回答1件
あなたの回答
tips
プレビュー