前提・実現したいこと
ここに質問の内容を詳しく書いてください。
pythonでスクレイピングをしています
サイトのhtmlが不完全なのか?データの抽出がうまくいきません。
<div id="primary-navigation" data-bk-dynamic="primary-navigation"> <ul> <li class="current"> <a href="/index">TOP</a> </li> <li class=""> <a href="/地図">店舗一覧</a> </li> <li class=""> <a href="/スマホ119の評判">お客様の評判</a> </li> <li class=""> <a href="/iPhone修理ブログ">修理ブログ</a> </li> <li class=""> <a href="/ブログ">ブログ</a> </li> <li class=""> <a href="/スタッフ紹介">スタッフ紹介</a> </li> <li class=""> <a href="/求人募集">求人募集</a> </li> <li class=""> <a href="/水没修理">水没修理</a> </li> <li class=""> <a href="/アップデート失敗復旧">システム復旧</a> </li> <li class=""> <a href="/機種変更データ移行">データバックアップ</a> </li> <li class=""> <a href="/データ復元">データ復元</a> </li> <li class=""> <a href="/3DSゲーム機修理">3DS修理</a> </li> <li class=""> <a href="/Androidスマホ修理">Android修理</a> </li> <li class=""> <a href="/iPad修理">iPad修理</a> </li> <li class=""> <a href="/iPhone基盤修理">基盤修理</a> </li> <li class=""> <a href="/出張修理">出張修理</a> </li> <li class=""> <a href="/iPhone買い取り">買取り</a> </li> <li class=""> <a href="/保証"> 保証内容</a> </li> <li class=""> <a href="/お客様相談窓口">お客様相談窓口</a> </li> <li class=""> <a href="/パソコン修理">パソコン修理</a> </li> <li class=""> <a href="/腕時計電池交換">時計電池交換</a> </li> <li class=""> <a href="/会社概要">会社概要</a> </li> <li class=""> <a href="/沖縄市泡瀬店">泡瀬店</a> </li> <li class=""> <a href="/宜野湾ベース">宜野湾店</a> </li> <li class=""> <a href="/豊見城市とよみ店">とよみ店</a> </li> <li class=""> <a href="/うるま市石川店">石川店</a> </li> <li class=""> <a href="/うるま市うるま店">うるま店</a> </li> <li class=""> <a href="/イオン名護店">イオン名護店</a> </li> <li class=""> <a href="/糸満店">糸満店</a> </li> <li class=""> <a href="/西原店">西原店</a> </li> <li class=""> <a href="/イオンモール鹿児島店">イオンモール鹿児島店</a> </li> <li class=""> <a href="/那覇オーパ店">那覇オーパ店</a> </li> <li class=""> <a href="/ワイモバイル">Y!モバイル</a> </li> </ul> </div><!-- #primary-navigation --> <!-- </div> --!> <div id="content" class="clearfix">エラーメッセージ none
python
試したこと
他のサイトでは、データが入っている部分をこのようにして抜け出しましたが、
main_body = soup.find("ul", {"class": "todouhukentop panel"})
今回のサイトの各ページへのリンク部分がどのようにしても抽出できません。
main_body = soup.find("div", {"id": "primary-navigation"})
このサイト:http://iphone119.xyz 自社サイトです。
真ん中のオレンジ部分の各ページへのリンクを抽出したい
そして、全ページのブログを抽出したい。
このサイトの場合はどのようにして、各ページのリンクを抽出すればよいのでしょうか?
はじめての質問です、質問の要領をつけめていない場合はすみません。
どうぞよろしくお願いいたします。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。

回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/07/20 12:00
2019/07/20 13:22