前提
Pythonを用いたスクレイピングの出力方法について。
下記のURL(https://100mon.jp/) から質問内容をスクレイピングするコードを作成しました。
実現したいこと
csv形式で出力すると添付写真のように、データが101行目から入力されます。
「自己紹介がしたい人に100の質問」は1-100行目に入力されますが、次の質問内容「片想いをしている人に100の質問」は101-の入力になります。これを1行目から入力する方法を知りたいです。
発生している問題・エラーメッセージ
![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-10-20/9b85d368-c135-4ece-8c96-c43cedaf7663.png)
該当のソースコード
Python
1import requests 2import re 3from bs4 import BeautifulSoup 4 5data=[] 6 7page_count = 1 8next_res = "" 9soup="" 10 11num=0 12 13while num<4342: 14 15 next_res=requests.get("https://100mon.jp/q/"+str(page_count)).text 16 soup=BeautifulSoup(next_res,'html.parser') 17 18 title = soup.find('h1',attrs={'class':'title'}) 19 20 all_questions=soup.find_all('ol') 21 22 for some_questions in all_questions: 23 for questions in some_questions: 24 question = questions 25 26 datum={} 27 28 datum[title.text]=question.text 29 data.append(datum) 30 31 page_count+=1 32 num +=1 33 34import pandas as pd 35df=pd.DataFrame(data) 36df.to_csv('100の質問50.csv',index=False) 37
補足情報(FW/ツールのバージョンなど)
Jupiter lab, Pythonを使用してます。
発生している問題・エラーメッセージのとこにのっています。こちらのURLから見られます。teratailで画像を添付するとこのような方法になるみたいです。
https://ddjkaamml8q8x.cloudfront.net/questions/2022-10-20/9b85d368-c135-4ece-8c96-c43cedaf7663.png
> teratailで画像を添付するとこのような方法になるみたいです。
そうではありません。添付の仕方が間違っています。
現状おそらく「コードの挿入」の中に「画像の挿入」をしてしまっています。投稿前にレビューで確認なさるようにお願いいたします。
回答1件
あなたの回答
tips
プレビュー