正規表現などを用いて抜き出した文字列をdataframeに保存しようと試したところ、なかなかうまくいきません。
実際のコードは以下のものになります
python
1import pandas as pd 2import csv 3import re 4 5lst = [] 6for i in range(1,5): 7 url1 = 'https://kabuoji3.com/stock/?page={}'.format(i) 8 print(url1) 9 dfs = pd.read_html(url1) 10 lst.extend(dfs) 11 dfr = pd.concat(lst, ignore_index=True) 12 13for j in dfr["コード・名称"]: 14 code = re.search('[0-9]{4}' , j) 15 print(code.group(),j[5:]) 16 dfr.assign("コード"=code.group()) 17 dfr.assign("銘柄名"=j[5:]) 18
最後の2桁が想定通りの動きをしません。
ちなみにコードは4桁の数字、銘柄名は (株)極洋
といったデータです。
この コード 、銘柄名 のデータが1つになってしまっているため
分割して保存しようとしております。ご回答よろしくお願いします>
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/09/23 15:45