前提・実現したいこと
1ページ目から10ページ目までの映画のタイトルをスクレイピング したいと思っています。
ページurlの取得まではできているのですが、dataframeに表示できないので教えてくださいmm
該当のソースコード
python
1url = 'https://movies.yahoo.co.jp/movie/' 2base = 'https://movies.yahoo.co.jp/' 3movies = soup.select('#list-module') 4names_japan = [] 5 6#1ページ目を格納 7urls.append(url) 8 9#2ページ目から10ページまでを格納 10num = 2 11while num <= 10: 12 url = base + 'movie/?page=' + str(num) 13 res = requests.get(url) 14 soup = bs4(res.text, 'html.parser') 15 num += 1 16 17 urls = [] 18 19 for i in range(len(urls)): 20 new_url = base + urls[i] 21 res = requests.get(new_url) 22 time.sleep(3) 23 soup = bs4(res.text, "html.parser") 24 title_elem = soup.select('h1 span') 25 title_elem = list(title_elem) 26 for m in title_elem: 27 names_japan.append(m.text) 28 29import pandas as pd 30df = pd.DataFrame({ '映画名/邦題':names_japan}) 31 32df
補足情報(FW/ツールのバージョンなど)
mac使用しています
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/10/30 01:36
2021/10/30 02:04
2021/10/30 08:00