質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.53%

  • Python 3.x

    6296questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

エラーの解決:'UCS-2' codec can't encode characters in position 1-1: Non-BMP character not supported in Tk

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 242

A_miyaki

score 2

概要

環境はPython 3.6.5です。

エラーメッセージは以下の通りです。

Traceback (most recent call last):
  File "C:\Users\mamet\AppData\Local\Programs\Python\Python36-32\analyze_image\get_image.py", line 41, in <module>
    pprint(photos)
  File "C:\Users\mamet\AppData\Local\Programs\Python\Python36-32\lib\pprint.py", line 53, in pprint
    printer.pprint(object)
  File "C:\Users\mamet\AppData\Local\Programs\Python\Python36-32\lib\pprint.py", line 139, in pprint
    self._format(object, self._stream, 0, 0, {}, 0)
  File "C:\Users\mamet\AppData\Local\Programs\Python\Python36-32\lib\pprint.py", line 167, in _format
    p(self, object, stream, indent, allowance, context, level + 1)
  File "C:\Users\mamet\AppData\Local\Programs\Python\Python36-32\lib\pprint.py", line 189, in _pprint_dict
    context, level)
  File "C:\Users\mamet\AppData\Local\Programs\Python\Python36-32\lib\pprint.py", line 346, in _format_dict_items
    context, level)
  File "C:\Users\mamet\AppData\Local\Programs\Python\Python36-32\lib\pprint.py", line 167, in _format
    p(self, object, stream, indent, allowance, context, level + 1)
  File "C:\Users\mamet\AppData\Local\Programs\Python\Python36-32\lib\pprint.py", line 210, in _pprint_list
    context, level)
  File "C:\Users\mamet\AppData\Local\Programs\Python\Python36-32\lib\pprint.py", line 389, in _format_items
    context, level)
  File "C:\Users\mamet\AppData\Local\Programs\Python\Python36-32\lib\pprint.py", line 167, in _format
    p(self, object, stream, indent, allowance, context, level + 1)
  File "C:\Users\mamet\AppData\Local\Programs\Python\Python36-32\lib\pprint.py", line 189, in _pprint_dict
    context, level)
  File "C:\Users\mamet\AppData\Local\Programs\Python\Python36-32\lib\pprint.py", line 346, in _format_dict_items
    context, level)
  File "C:\Users\mamet\AppData\Local\Programs\Python\Python36-32\lib\pprint.py", line 176, in _format
    stream.write(rep)
UnicodeEncodeError: 'UCS-2' codec can't encode characters in position 1-1: Non-BMP character not supported in Tk
>>> 
コード

ソースコードを以下に記載。

from flickrapi import FlickrAPI
from urllib.request import urlretrieve
from pprint import pprint
import os, time

# API キーの情報

key = "####取得したキーを入力"
secret = "#####取得したsecretを入力"

# 重要:リクエストを送るタイミングが短すぎると画像取得先のサーバを逼迫してしまうか、
# スパムとみなされてしまう可能性があるので、待ち時間を 1 秒間設ける。
wait_time = 1

# コマンドライン引数の 1 番目の値を取得
vehiclename = input('検索項目>>')#本来はsys.argv[1]でコマンドラインから引数を取得
# 画像を保存するディレクトリを指定
savedir = "./" + vehiclename

# FlickrAPI にアクセス

# FlickrAPI(キー、シークレット、データフォーマット{json で受け取る})
flickr = FlickrAPI(key, secret, format='parsed-json')
result = flickr.photos.search(
    # 検索キーワード
    text = vehiclename,
    # 取得するデータ件数
    per_page = 400,
    # 検索するデータの種類(ここでは、写真)
    media = 'photos',
    # データの並び順(関連順)
    sort = 'relevance',
    # UI コンテンツを表示しない
    safe_search = 1,
    # 取得したいオプションの値(url_q->画像のアドレスが入っている情報、licence -> ライセンス情報)
    extras = 'url_q, licence'
)

# 結果を表示
photos = result['photos']
pprint(photos)

# 追記
for photo in photos['photo']:
    url_q = photo['url_q']
    filepath = savedir + '/' + photo['id'] + '.jpg'
    # ファイルが重複していたらスキップする
    if os.path.exists(filepath): continue
    # データをダウンロードする
    urlretrieve(url_q, filepath)
    # 重要:サーバを逼迫しないように 1 秒待つ
    time.sleep(wait_time)
コード

試したこと

今のところ試したことはありません。
調べたところUCS-2が今の環境に対応したものでないことと、それが絵文字などのデータ類であること、その程度です。

 補足情報(FW/ツールのバージョンなど)

エラーが表示されたのは検索項目に'ship'を指定してコマンドを実行したときです。
必要なライブラリ群はすべて最新のものに更新してあります。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • quiqui

    2018/06/26 11:51 編集

    「要るでしょうか」は「要るだろうと推測します」という意味でした。すみません。今の質問だとどうやって実行しているかもわかりませんし、エラーが出ている箇所もわかりません。

    キャンセル

  • quiqui

    2018/06/26 11:52

    「エラーの全文」はバックトレースも含めた全部という意味です。

    キャンセル

  • A_miyaki

    2018/06/26 12:03

    意図を理解できていませんでした。実行はPythonに付属しているIDLEを使用しています。一応PyCharmはインストールしてありますが、Anacondaは入っていません。エラーは最後に表示されている部分のみです。全文で記載しなおします。

    キャンセル

回答 1

checkベストアンサー

+2

提示メッセージと以下の検証結果からIDLE上で実行させておりpprint(photos)行で発生していると推測して回答します。

Python 3.5.5 |Anaconda custom (64-bit)| (default, Apr  7 2018, 04:52:34) [MSC v.1900 64 bit (AMD64)] on win32
Type "copyright", "credits" or "license()" for more information.
>>> from pprint import pprint
>>> pprint('a\U0001F44D')
Traceback (most recent call last):
  File "<pyshell#1>", line 1, in <module>
    pprint('a\U0001F44D')
  File "C:\Program Files\Anaconda3\lib\pprint.py", line 53, in pprint
    printer.pprint(object)
  File "C:\Program Files\Anaconda3\lib\pprint.py", line 139, in pprint
    self._format(object, self._stream, 0, 0, {}, 0)
  File "C:\Program Files\Anaconda3\lib\pprint.py", line 176, in _format
    stream.write(rep)
  File "C:\Program Files\Anaconda3\lib\idlelib\PyShell.py", line 1344, in write
    return self.shell.write(s, self.tags)
UnicodeEncodeError: 'UCS-2' codec can't encode characters in position 2-2: Non-BMP character not supported in Tk
>>> 

絵文字などのUnicodeBMP外の文字がphotosに含まれていると提示エラーが発生します。
BMP外の文字をBMP内の文字に置換することでprintできるようになります。

参考:'UCS-2' codec can't encode characters in position 1050-1050

import sys
# BMP外の文字を0xfffd(REPLACEMENT CHARACTER)に置き換えるためのマップ
non_bmp_map = dict.fromkeys(range(0x10000, sys.maxunicode + 1), 0xfffd)

# ?に置き換えることもできる
# cp932環境などREPLACEMENT CHARACTERも表現できない場合など
non_bmp_map = dict.fromkeys(range(0x10000, sys.maxunicode + 1), 0x003f)

s = '\U0001F44Dabc' # 👍abc
print( s.translate(non_bmp_map))

なお、エラーメッセージ全文(Traceback)にはエラーの発生場所も含め問題解決のために重要な情報が含まれていますので、可能な限り省略せずに提示ください。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/06/26 12:09

    エラーメッセージは全文で記載しなおしました。推測されたとおり、pprint (photo)でエラーが出ていました。少ない情報から解決策まで提示していただきありがとうございます。

    キャンセル

  • 2018/06/26 20:19

    最終的に回答と回答で示していただいたURL、https://teratail.com/questions/90318を参考に39行目以下にif関数を用いて、解決しました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.53%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Python 3.x

    6296questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。