質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.52%

  • Python 2.7

    1264questions

    Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

  • Scrapy

    82questions

    Scrapyは、Pythonで開発されたオープンソースソフトウェアです。スクレイピングという、Webサービスから必要な情報を取り出したり自動操作をしたりする技術を使うものです。

"display none"で非表示しているWEBサイトのスクレイピング(Scrapy利用)

受付中

回答 0

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 311

haduki08

score 3

Python+ScrapyでWEBスクレイピング技術を勉強中です。

環境は下記の通り
・Python 2.7.11
・Scrapy 1.4.0

対象サイト:https://www.hituji.jp/comret/search/area

divtタグの'searchList'クラス配下に複数のdivタグで要素が配置されているのですが
CSSのdisplay noneで非表示されていて、ファーストビューの30件しか抽出できません。

何か手法はありますでしょうか?

# -*- coding: utf-8 -*-
import scrapy

from WebScraping.items import WebscrapingItem

class HitujiListSpider(scrapy.Spider):
    name = 'hituji_list'
    allowed_domains = ['www.hituji.jp']
    start_urls = ['https://www.hituji.jp/comret/search/area']

    def parse(self, response):
        article = WebscrapingItem()

        for d in response.xpath('//div[contains(@class, "follow-component")]'):
            if d:
                article['title']  = d.xpath('div[@class="searchList__articleInfo"]/div[contains(@class, "Title")]/a/text()').extract()
                article['url'] = d.xpath('div[@class="searchList__articleInfo"]/div[contains(@class, "Title")]/a/@href').extract()
                yield article
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

まだ回答がついていません

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.52%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Python 2.7

    1264questions

    Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

  • Scrapy

    82questions

    Scrapyは、Pythonで開発されたオープンソースソフトウェアです。スクレイピングという、Webサービスから必要な情報を取り出したり自動操作をしたりする技術を使うものです。