🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

3回答

678閲覧

pythonで取得したHTMLコードから数字を取り出せない

kokastar

総合スコア5

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/12/15 10:45

編集2019/12/15 10:57

前提・実現したいこと

webスクレイピングの練習として、Scratchのユーザーのフォロワー数を調べるプログラムを作っています。
取得したHTMLの中のh2要素から数字を取り出す部分を実装中に以下のエラーメッセージが発生しました。

発生している問題・エラーメッセージ

本名が特定される可能性のあるアカウント名は、「*****」としています

Who will investigate?kokastar ※ここで、ユーザー名を指定している Traceback (most recent call last): File "c:\Users*****.vscode\extensions\ms-python.python-2019.11.50794\pythonFiles\ptvsd_launcher.py", line 43, in <module> main(ptvsdArgs) File "c:\Users*****.vscode\extensions\ms-python.python-2019.11.50794\pythonFiles\lib\python\old_ptvsd\ptvsd\__main__.py", line 432, in main run() File "c:\Users*****.vscode\extensions\ms-python.python-2019.11.50794\pythonFiles\lib\python\old_ptvsd\ptvsd\__main__.py", line 316, in run_file runpy.run_path(target, run_name='__main__') File "C:\Users*****\AppData\Local\Programs\Python\Python38\lib\runpy.py", line 262, in run_path return _run_module_code(code, init_globals, run_name, File "C:\Users*****\AppData\Local\Programs\Python\Python38\lib\runpy.py", line 95, in _run_module_code _run_code(code, mod_globals, init_globals, File "C:\Users*****\AppData\Local\Programs\Python\Python38\lib\runpy.py", line 85, in _run_code exec(code, run_globals) File "c:\Users*****\OneDrive\デスクトップ\フォロワー人数調査\フォロワー人数調査.py", line 11, in <module> followers = re.sub("\D", "", a) File "C:\Users*****\AppData\Local\Programs\Python\Python38\lib\re.py", line 208, in sub return _compile(pattern, flags).sub(repl, string, count) TypeError: expected string or bytes-like object

全体のソースコード

python3.8

1import requests 2from bs4 import BeautifulSoup 3import re 4 5user_name = input("Who will investigate?") 6html = requests.get('https://scratch.mit.edu/users/'+ user_name +'/followers/') 7HTML = (html.content) 8 9soup = BeautifulSoup(HTML, "html.parser") 10a = (soup.select("h2")) 11followers = re.sub("\D", "", a) 12print(followers)

試したこと

下から2行目の変数「followers」の定義のところで変数「a」を、実際に取得したh2要素の情報に置き換えるとうまくいきました。

補足情報(FW/ツールのバージョンなど)

pythonのバージョン 3.8.0
requestsのバージョン 2.22.0
beautifulsoup4のバージョン 4.8.1

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2019/12/15 10:48

エラー発生箇所が特定出来るようにエラーメッセージを載せてください。
guest

回答3

0

ベストアンサー

select()は結果をリストで返すのでエラーが発生しているかと思われます。
リスト(a)から要素を取り出して、re.subの引数にすれば良いと思います。

投稿2019/12/15 11:03

meg_

総合スコア10736

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

aがリストであったので、a[0]を使ってリストの1番目の要素をb取り出し、それをstr関数で文字列に変換することで解決しました

python3.8

1import requests 2from bs4 import BeautifulSoup 3import re 4 5user_name = input("Who will investigate?") 6html = requests.get('https://scratch.mit.edu/users/'+ user_name +'/followers/') 7HTML = (html.content) 8 9soup = BeautifulSoup(HTML, "html.parser") 10a = (soup.select("h2")) 11b=str(a[0]) 12followers = re.sub("\D", "", b ) 13print(followers)

投稿2019/12/16 05:58

kokastar

総合スコア5

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

aはリストであるので、a[0]を追加して1番目の要素を取り出し、それを文字列に変換することで解決しました。

python3.8

1import requests 2from bs4 import BeautifulSoup 3import re 4 5user_name = input("Who will investigate?") 6html = requests.get('https://scratch.mit.edu/users/'+ user_name +'/followers/') 7HTML = (html.content) 8 9soup = BeautifulSoup(HTML, "html.parser") 10a = (soup.select("h2")) 11b=str(a[0]) 12followers = re.sub("\D", "", b ) 13print(followers)

投稿2019/12/16 05:55

kokastar

総合スコア5

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問