Seleniumでハローワークの「仕事の内容」を取得する方法

Question

Python Seleniumでハローワークの「仕事の内容」を取得する方法を教えて下さい。 https://www.geek.sc/archives/2975 を見ながらスクレイピングしていて、このホームページと同じことは出来ました。でも、せめてハローワークの「仕事の内容」も表示させたいです。タイトルだけではどんな仕事か分かりづらいですよね。以下がGoogle Chromeでハローワークの検索した結果を表示し、「仕事の内容」のところに合わせて右クリックして「ページのソースコードを表示」「検証…」を選択した結果です。この中に答えがあると思っています: ```HTML : 仕事の内容

ＷＥＢアプリ開発。ＪＡＶＡ，Ｐｙｔｈｏｎ。基本設計、詳細から開発・テストまで。写真ご覧ください

: ``` 「仕事の内容」は**job_description**という名前で取得します。いろいろ試しているのですが、どこを捕まえていいのか分かりません。 {"class" : "fb"}を捕まえたら「職種」が表示されました…。 ```Python for i, job in enumerate(jobs): job_name = str(job.find("td", attrs={"class": "m13"}).text.strip()) job_description = str(job.find("td", attrs={"class": "fb"})) salary_tags = job.find_all("tr",attrs={"class": "border_new"})[5].select(".disp_inline_block") for t, salary_tag in enumerate(salary_tags): job_salary = salary_tag.text message = message + "■{0} （ {1} ） {2} ".format(job_name, job_salary, job_description) ``` Python出力結果: ``` ■ＡＷＳシステム（〇〇市）（ 250,000円〜500,000円）職種 ■ＡＷＳインフラ（〇〇市）（ 250,000円〜500,000円）職種 ``` 期待している出力結果: ``` ■ＡＷＳシステム（〇〇市）（ 250,000円〜500,000円）ＷＥＢアプリ開発。ＪＡＶＡ，Ｐｙｔｈｏｎ。基本設計、詳細から開発・テストまで。写真ご覧ください ■ＡＷＳインフラ（〇〇市）（ 250,000円〜500,000円）ＡＷＳインフラの整備。必須スキルは〇〇。 ``` 色々調べていますが、どうやったら「仕事の内容」が取得できるのか分かりません。どうか教えて下さい。お願いします。

Accepted Answer

以下で仕事内容の取得が可能です。
`.find()`メソッドで引数に[仕事の内容]という文字列を指定し対象の要素を取得します。
この時取得した要素の中身は単純な文字列ではありますが、typeはbs4elementである為
更にここからこの文字列を指定して`.find`系メソッドの使用が可能です。
`.parent`で[仕事の内容]という文字列が含まれる親要素を指定し
更にその兄弟要素を取得し`.text`で文字列化します。

```python
for i, job in enumerate(jobs):
    job_name = str(job.find("td", attrs={"class": "m13"}).text.strip())
    salary_tags = job.find_all("tr",attrs={"class": "border_new"})[5].select(".disp_inline_block")
    for t, salary_tag  in enumerate(salary_tags):
        job_salary = salary_tag.text

    job_description = job.find(string='仕事の内容').parent.find_next_sibling().text.replace('
', '')
    message = message + "■{0} （ {1} ） 
□{2}
".format(job_name, job_salary, job_description)
```

関連した質問