質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.37%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

59閲覧

Bookwakerの商品サイトからタイトルや値段を取得するスクレイピングの実現方法

KHON

総合スコア10

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2024/11/09 18:46

実現したいこと

Bookwakerの商品ページから漫画のタイトルや値段などを取得してDBに格納し、
値引き時の購入漏れを防ぐプログラムを構築したいと考えています。

発生している問題・分からないこと

下記プログラムをPythonにて実行しているのですが、タグ情報までは取得できますが、
漫画のタイトルや値段を取得する方法がわかりません。
どのように記述すると取得可能でしょうか?

また、2行同じHTMLコードが表示されるのも回避したいです。

該当のソースコード

import requests from bs4 import BeautifulSoup # スクレイピングするウェブページのURL url = 'https://bookwalker.jp/category/2/?order=release' # ウェブページにGETリクエストを送る response = requests.get(url) # ウェブページの内容を解析する soup = BeautifulSoup(response.content, 'html.parser') # データを含む要素を見つける # ここではリストアイテムの番号をスクレイピングすることを想定しています list_items = soup.find_all(class_='m-book-item__title') # データを抽出して表示する for item in list_items: print(item)

試したこと・調べたこと

  • teratailやGoogle等で検索した
  • ソースコードを自分なりに変更した
  • 知人に聞いた
  • その他
上記の詳細・結果

正規表現で置換しようとしましたが、エラーで変更できなかったです。

補足

特になし

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.37%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問