前提・実現したいこと
day ファイル名 LINK
January 17, 2021 A urla
January 17, 2021 B urlb
となる表を作りたい
発生している問題・エラーメッセージ
リンクにファイル名が明記されているので
linkからさらにリプレイスしてファイル名を追加してpandasを利用して
day ファイル名 LINK
January 17, 2021 A urla
January 17, 2021 B urlb
となるようにしたいが
day LINK
January 17, 2021 urla,urlb
January 17, 2021 urlc
となってしまう
該当のソースコード
python
1d_list=[] 2 3 4for url in unique_list : 5 res = requests.get(url) 6 res.raise_for_status() 7 soup =BeautifulSoup(res.text, "html.parser") 8 9 c=soup.find("div", attrs={"class": "entry-content"}) 10 urls=[] 11 tag_list = c.select('a[href]') 12 for tag in tag_list: 13 url = tag.get('href') 14 urls.append(url) 15 16 c=soup.find("div", attrs={"class": "entry-meta clear"}) 17 c=c.text 18 c=c.replace('\n', '') 19 day=c.replace('\t', '') 20 21 22 d = {'link': urls, 'days': day,} 23 d_list.append(d) 24d_list 25 26[{'days': 'January 18, 2021', 27 'link': ['https://www.-A.html', 28 'https://www.B.mp4.html']}, 29 {'days': 'January 17, 2021', 30 'link': ['https://www.-A.mp4.html', 31 'https://www.-B.mp4.html', 32 'https://www.-C.mp4.html']},
試したこと
リンク取得部分を変更すればいいのか?取得後のリストを加工すればいいのか方法がわかりません。参考となるアドバイス宜しくお願い致します。
。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。