Python Seleniumでハローワークの「仕事の内容」を取得する方法を教えて下さい。
https://www.geek.sc/archives/2975
を見ながらスクレイピングしていて、
このホームページと同じことは出来ました。
でも、せめてハローワークの「仕事の内容」も表示させたいです。
タイトルだけではどんな仕事か分かりづらいですよね。
以下がGoogle Chromeでハローワークの検索した結果を表示し、
「仕事の内容」のところに合わせて右クリックして
「ページのソースコードを表示」「検証…」を選択した結果です。
この中に答えがあると思っています:
HTML
1 : 2<tr class="border_new"> 3 4<td class="fb in_width_9em">仕事の内容</td> 5<td> 6<div>WEBアプリ開発。JAVA,Python。基本設計、詳細から開発・テストまで。写真ご覧ください</div> 7 8</td> 9</tr> 10 :
「仕事の内容」はjob_descriptionという名前で取得します。
いろいろ試しているのですが、どこを捕まえていいのか分かりません。
{"class" : "fb"}を捕まえたら「職種」が表示されました…。
Python
1for i, job in enumerate(jobs): 2 job_name = str(job.find("td", attrs={"class": "m13"}).text.strip()) 3 job_description = str(job.find("td", attrs={"class": "fb"})) 4 salary_tags = job.find_all("tr",attrs={"class": "border_new"})[5].select(".disp_inline_block") 5 for t, salary_tag in enumerate(salary_tags): 6 job_salary = salary_tag.text 7 message = message + "■{0} ( {1} ) {2}\n".format(job_name, job_salary, job_description) 8
Python出力結果:
■AWSシステム(〇〇市) ( 250,000円〜500,000円 ) <td class="fb"> <strong>職種</strong> </td> ■AWSインフラ(〇〇市) ( 250,000円〜500,000円 ) <td class="fb"> <strong>職種</strong> </td>
期待している出力結果:
■AWSシステム(〇〇市) ( 250,000円〜500,000円 ) WEBアプリ開発。JAVA,Python。基本設計、詳細から開発・テストまで。写真ご覧ください ■AWSインフラ(〇〇市) ( 250,000円〜500,000円 ) AWSインフラの整備。必須スキルは〇〇。
色々調べていますが、どうやったら「仕事の内容」が取得できるのか分かりません。
どうか教えて下さい。お願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/10/25 13:28
2020/10/26 03:04
2020/10/26 11:56