質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

87.58%

このエラーコードの意味を教えて下さい!

解決済

回答 2

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 626

score 1

前提・実現したいこと

pythonの勉強を始めたばかりのものです。
「文系でもわかるプログラミング副業入門」という本を読み、
メルカリやラクマから最安値をスクレイピングする課題に取り組んでいます。
その中で「UnicodeEncodeError: 'latin-1' codec can't encode characters in position 120-125: ordinal not in range(256)」というエラーに遭遇し、前に進めなくなりました。
このエラーは何を意味しているのでしょうか?

不勉強で申し訳ございませんが、ご教授お願い致します。

発生している問題・エラーメッセージ

Traceback (most recent call last):
  File "kakaku_scraping.py", line 18, in <module>
    response = requests.get(url, headers = USER_AGENT)
  File "/opt/anaconda3/lib/python3.8/site-packages/requests/api.py", line 76, in get
    return request('get', url, params=params, **kwargs)
  File "/opt/anaconda3/lib/python3.8/site-packages/requests/api.py", line 61, in request
    return session.request(method=method, url=url, **kwargs)
  File "/opt/anaconda3/lib/python3.8/site-packages/requests/sessions.py", line 530, in request
    resp = self.send(prep, **send_kwargs)
  File "/opt/anaconda3/lib/python3.8/site-packages/requests/sessions.py", line 643, in send
    r = adapter.send(request, **kwargs)
  File "/opt/anaconda3/lib/python3.8/site-packages/requests/adapters.py", line 439, in send
    resp = conn.urlopen(
  File "/opt/anaconda3/lib/python3.8/site-packages/urllib3/connectionpool.py", line 670, in urlopen
    httplib_response = self._make_request(
  File "/opt/anaconda3/lib/python3.8/site-packages/urllib3/connectionpool.py", line 392, in _make_request
    conn.request(method, url, **httplib_request_kw)
  File "/opt/anaconda3/lib/python3.8/http/client.py", line 1255, in request
    self._send_request(method, url, body, headers, encode_chunked)
  File "/opt/anaconda3/lib/python3.8/http/client.py", line 1296, in _send_request
    self.putheader(hdr, value)
  File "/opt/anaconda3/lib/python3.8/http/client.py", line 1228, in putheader
    values[i] = one_value.encode('latin-1')
UnicodeEncodeError: 'latin-1' codec can't encode characters in position 120-125: ordinal not in range(256)

該当のソースコード

from time import sleep
import bs4
import requests


MERCARI = ['メルカリ','https://www.mercari.com/jp/search/?sort_order=price_asc&keyword=%E3%83%AB%E3%83%B3%E3%83%90980&category_root=7&category_child=101&category_grand_child%5B875%5D=1&brand_name=&brand_id=&size_group=&price_min=&price_max=&item_condition_id%5B1%5D=1&status_on_sale=1','<p class="search-result-description">該当する商品が見つかりません。検索条件を変えて、再度お試しください。</p>']

RAKUMA = ['ラクマ','https://fril.jp/s?order=asc&query=%E3%83%AB%E3%83%B3%E3%83%90980&sort=sell_price&status=new&transaction=selling','body > div.drawer-overlay > div > div > div > div > div > div.search_tab > section > div.content > section > div:nth-child(1) > div > div.item-box__text-wrapper > div:nth-child(3) > p > span:nth-child(2)','']

QUERY_INFOS = [MERCARI,RAKUMA]


USER_AGENT = {"USER_AGENT": "Mozilla/5.0 (Macintosh; Intel Mac OS X 11_2_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.192 Safari/537.36表示サイズ: 1420 x 707pix"}

for info in QUERY_INFOS :
    sleep(2)
    url = info[1]
    response = requests.get(url, headers = USER_AGENT)
    response.encoding = response.apparent_encoding
    html = response.text
    soup = bs4.BeautifulSoup(html, 'html.parser')

    try : 
      #商品が見つかったかどうかのチェック
        if info[3] != '' :
            if soup.select(info[3]) :
                raise ValueError()
     #価格を抜き出す
        prices = soup.select(info[2])
        print(info[0] + ':' +  prices[0].getText())
    except :
     #商品が見つからなかったことを表示
        print(info[0] + ':見つかりませんでした。'

試したこと

一通りスペルはチェックしました。
抜け漏れあるかもしれません、、、

補足情報(FW/ツールのバージョンなど)

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • noukanaruo

    2021/03/05 14:18

    前の部分も含めて内容確認してみます!

    キャンセル

  • miyabi_takatsuk

    2021/03/05 14:38

    エラー文を翻訳にかけてみましたか?
    検索してもわからなければ、翻訳にかけてみると、理解できる可能性があります。

    キャンセル

  • noukanaruo

    2021/03/05 14:43

    ありがとうございます!
    全文を翻訳して読み解いていきます。

    キャンセル

回答 2

checkベストアンサー

+1

エラーの意味は K_3578 さんが提示されていますので、考えられる要因の方を挙げておきます。

USER_AGENT = {"USER_AGENT": "Mozilla/5.0 ... 表示サイズ ..."}


と漢字の入った USER_AGENT を requests.get() の headers に指定しています。

USER_AGENT = {"USER_AGENT": "Mozilla/5.0 ... 表示サイズ ...".encode()}   # .encode('utf_8') と同じ


等の encode が必要なのではありませんか。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2021/03/05 15:35

    lenshell様
    ご回答ありがとうございます。
    ご指摘の通り修正いたしましたところ
    無事エラーも出ず、思った通りの結果が出力されました!
    本当にありがとうございます!

    質問する以前のことも多く、お手数おかけしました。
    以後気をつけて、pythonを学んでいけたらと思います。

    ありがとうございました。

    キャンセル

+1

私はPythonは詳しくないのであくまでエラーコード出たときの対処ですが
まず、Google翻訳とかに掛けてみる。今回出ているエラーコードを掛けてみました。

UnicodeEncodeError: 'latin-1'コーデックは位置120-125の文字をエンコードできません:序数がrange(256)にありません

と出ました。これは私が無知なだけかもしれませんがよくわかりませんね。なのでエラーメッセージを切り分けて検索してみます。

UnicodeEncodeError検索してみた所、沢山先駆者の記事が出てきました。
イメージ説明
この辺が参考になりそうですね。では自分で読んで調べてみましょう。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 87.58%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る