質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

668閲覧

Pythonスクレイピングについて タグの設定(soup.find_all)

tontondoor

総合スコア2

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/06/14 13:38

Pythonについてご質問。
検索した内容(社名、リンク先)をスクレイピングしたいです。

タグの設定「m-article-card__header__title__link」が誤っているとは思うのですが、
どうすれば正しい式になるでしょうか?

import requests
from bs4 import BeautifulSoup
import pandas as pd

#不動産と東京で検索
load_url = "https://itp.ne.jp/keyword/?keyword=%E4%B8%8D%E5%8B%95%E7%94%A3&areaword=%E6%9D%B1%E4%BA%AC&sort=01&sbmap=false"
html = requests.get(load_url)
soup = BeautifulSoup(html.content, "html.parser")
spots = soup.find_all('div',attrs={'class': 'm-article-card__header__title__link'})
spots

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

こんな感じです。

python

1>>> import requests 2>>> from bs4 import BeautifulSoup 3>>> import pandas as pd 4>>> 5>>> load_url = "https://itp.ne.jp/keyword/?keyword=%E4%B8%8D%E5%8B%95%E7%94%A3&areaword=%E6%9D%B1%E4%BA%AC&sort=01&sbmap=false" 6>>> html = requests.get(load_url) 7>>> soup = BeautifulSoup(html.content, "html.parser") 8>>> spots = soup.find_all("h2", class_="m-article-card__header__title") 9>>> 10>>> df = pd.DataFrame([[spot.text.strip(), spot.find('a').get('href')] for spot in spots], columns = ['社名', 'リンク先']) 11>>> print(df) 12 社名 リンク先 130 株式会社リロケーションハウス https://itp.ne.jp/info/134005517100000899/ 141 株式会社津田不動産鑑定事務所 https://itp.ne.jp/info/133904350174761780/ 152 三井不動産リアルティ株式会社/コンサルティング営業部新宿オフィス https://itp.ne.jp/info/132484853113480520/lp/1 163 株式会社リロケーションハウス https://itp.ne.jp/info/134005517100000899/ 174 東急リバブル株式会社売買部門麻布センター https://itp.ne.jp/info/130972628163051710/ 185 東急リバブル株式会社渋谷センター https://itp.ne.jp/info/510000000000075974/ 196 東急リバブル株式会社代々木上原センター https://itp.ne.jp/info/510000000000077168/ 207 東急リバブル株式会社三軒茶屋センター https://itp.ne.jp/info/510000000000077450/lp/1 218 東急リバブル株式会社中目黒センター https://itp.ne.jp/info/520000007540030001/ 229 東急リバブル株式会社高円寺センター https://itp.ne.jp/info/520000064131690001/lp/1 2310 株式会社イースマイル東京本社 https://itp.ne.jp/info/520000084978190001/ 2411 賃貸専門の三幸株式会社/永福町店 https://itp.ne.jp/info/130774653191531300/ 2512 日本住宅情報株式会社 https://itp.ne.jp/info/135015223100000899/ 2613 株式会社渡辺工業 https://itp.ne.jp/info/135070351110161220/ 2714 株式会社ホシノイエ https://itp.ne.jp/info/520000300939380001/ 2815 東急リバブル株式会社/立川センター https://itp.ne.jp/info/133673906169941500/ 2916 東急リバブル株式会社調布センター https://itp.ne.jp/info/510000000000077314/ 3017 本間不動産 https://itp.ne.jp/info/139368847100000899/ 3118 光洋不動産 https://itp.ne.jp/info/135043874100000899/ 3219 山一不動産 https://itp.ne.jp/info/134286383100000899/ 3320 株式会社巴不動産 https://itp.ne.jp/info/133300503100000899/

投稿2021/06/14 14:15

ppaul

総合スコア24670

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tontondoor

2021/06/14 23:48

表示されました。すごいです。 ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問