質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

解決済

2回答

894閲覧

スクレイピングでWeb画面上の表示がElements上の表示と一致しない

mi2

総合スコア63

Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

0クリップ

投稿2019/05/07 01:28

前提・実現したいこと

スクレイピングでWeb画面上の表示がElements上の表示が一致しないため、取得したい値が取れていないです。

Web画面上の表示は、AAA111R / 111RIIです。
IIは正確には||のような表記です。(記号のようなもの)

これをスクレイピングするためにElementsを確認したところ、
Elements上の表示は、AAA111R / 111R?となっております。

発生している問題

スクレイピングした結果についてもAAA111R / 111R?と表示され、?となってしまいます。
Web画面上の表示の通り、AAA111R / 111RIIの形で取得する方法はありますでしょうか。
それとも、Elementsに表示されないものは取れないという認識が正解でしょうか。
コメントや参考になるURL等がございましたら、頂戴できますと幸いです。

参考

https://orangain.hatenablog.com/entry/encoding-in-requests-and-beautiful-soup
上記等を参考に、Beautiful Soupを用いたスクレイピングを行っています。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

can110

2019/05/07 01:47

ブラウザ上でその文字を選択コピーしてテキストエディタに貼り付けた結果を追記ください。 また差支えなければ取得ページのURLを追記ください。
mi2

2019/05/07 02:08 編集

> ブラウザ上でその文字を選択コピーしてテキストエディタに貼り付けた結果を追記ください。 画像上の文字のため、テキストエディタに貼り付けることができませんでした。
guest

回答2

0

これをスクレイピングするためにElementsを確認したところ、

確認の仕方が悪くて、文字コード変換時に?になってしまっているのでは?

投稿2019/05/07 05:32

otn

総合スコア84559

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

HTMLソースから「?」表記になっているので、alt属性から取得するのは不可能と思われます。
可能かどうか分かりませんが、詳細ページに移動してどうにかして車種名のテキスト要素を特定して取得するしかないでしょう。

投稿2019/05/07 02:04

can110

総合スコア38266

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

mi2

2019/05/07 02:07

ありがとうございます。 別の取得方法を考えてみようと思います。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問