質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

7695閲覧

BeautifulSoupで空白が入るclass名の処理方法

kaneuchi

総合スコア12

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2019/04/30 10:33

前提・実現したいこと

PythonでWebスクレイピングによる情報収集するプログラムを作成しています。
Webサイトは私自身が作成してるわけではないため、htmlの書き方は常に正しいとは限らない状況です。

発生している問題・エラーメッセージ

html内のclass名にはスペースが入っているものがあり、for文を使い select_one()などで スペースの入っているclass名を指定すると正しく処理ができません。

set_span = elm.select_one('.set') AttributeError: 'NoneType' object has no attribute 'select_one'

該当のソースコード

python3

1for clazz in ['desc', 'bold', 'create name']: 2 elm = item.select_one('.' + clazz) 3 set_span = elm.select_one('.set_item')

試したこと

初めはなぜエラーになるかがわからなかったのですが、もしかしてと思い、htmlをローカルにファイルとして保存してから、当該の class名を 'create name' から 'create_name' とスペースをアンダースコアーに変更し、それに合わせ python3 の for文 inも 'create_name' に変更したところ、正常に処理することができました。

今回は原因切り分けとしてローカルファイルとして処理しましたが、requests.get を使いオンラインで処理をするにはどの様な処理をすればよろしいでしょうか。

よろしくお願い致します。

補足情報(FW/ツールのバージョンなど)

OSX 10.13.6
python 3.7.0
beautifulsoup4 4.7.1

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

HTMLで、空白を含むクラスは、スペース区切りで複数のクラスを指定していると解釈されます。create nameというクラスにはなりません。

それ用のCSSセレクタの記法(.create.nameのようにします)があるので、それに従ってください。

複数のclassをセレクタに指定する方法 | Blog hamashun.com
スペースを含んだクラス名を jquery で指定できない - スタック・オーバーフロー

投稿2019/04/30 10:45

hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問