質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

3236閲覧

Python3のNoneおよびNoneTypeを排除したい

退会済みユーザー

退会済みユーザー

総合スコア0

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2018/08/06 08:53

Webスクレイピングをしています。

ある条件に当てはまるliタグをすべて見つけ、そのうち、aタグのあるものだけを取得、その文字列を出力したいです。

以下のコードで、余計なものを排除したつもりなのですが、エラーが出てしまいます。
None(NoneType?)の問題なのですが、どうもうまく弾くことができません。

どうすれば、正しくNoneTypeを弾くことができるでしょうか?

回答よろしくお願いします。

python3

1if li is not None and isinstance(li, element.Tag): 2 print(li.find('a').text)

error

1Traceback (most recent call last): 2 File "scraper.py", line 13, in <module> 3 print(li.find('a').text) 4AttributeError: 'NoneType' object has no attribute 'text'

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

いったん別の変数に代入して、Noneかどうか調べれば良いです。

Python

1found = li.find('a') 2if found is not None: 3 print(found.text)

BeautifulSoupを利用されているという仮定の下で追記します。

selectメソッドを用いれば、li要素直下のa要素だけを抽出できます。

Python

1for a_elem in soup.select('li > a'): 2 print(a_elem.text)

スクレイピングをする以上はこういうのを自力で調べる能力も大事です。
Beautiful Soup 4.2.0 Doc. 日本語訳

投稿2018/08/06 08:56

編集2018/08/06 09:24
LouiS0616

総合スコア35660

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2018/08/06 08:59

うまくいきました。回答ありがとうございます。 しかし、疑問が残ります。なぜ、変数に格納するのとしないのとで、結果が異なるのでしょうか?
LouiS0616

2018/08/06 09:00

if文が存在するか否かの差です。 変数にいったん代入したのはif文を使うためだけで、本質には影響しません。
LouiS0616

2018/08/06 09:02 編集

Pythonをしっかり勉強してください。 特にスクレイピングは他者に迷惑をかけ得るので、充分な知識の下で行うべきです。
退会済みユーザー

退会済みユーザー

2018/08/06 09:12

liがNoneか否かではなく、li.found('a')がNoneか否かが問題だったということですね?
LouiS0616

2018/08/06 09:14

そうなりますね。 liがNoneだったら'NoneType' object has no attribute 'find'というエラーが先に出るはずです。
退会済みユーザー

退会済みユーザー

2018/08/06 09:17

確かにそうですね。納得しました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問