質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.51%

  • HTML

    11446questions

    HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

  • Python 3.x

    9775questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • Unicode

    73questions

    Unicodeはエンコーディングの標準規格です。1つの文字コード体系で多国語の表現を可能にすることを目指して作られています。

python3でUnicodeEncodeErrorが解決できません

解決済

回答 1

投稿

  • 評価
  • クリップ 1
  • VIEW 1,143

TakumaSato

score 8

前提・実現したいこと

python3.5.1 を用いて、みんなのpython webアプリ編を学習しています。
("webアプリケーションに値を渡す"に該当。)

以下の動作をするスクリプトを作りたいです。
・UIで現在の西暦の前後10年をoptionに与える。
・選ばれたoptionの西暦に13日の金曜日が何回あるかを返す。

自分なりにいろいろと試してみましたが解決できませんでした。
ご教授の程よろしくお願い致します。

発生している問題・エラーメッセージ

line 44, in <module>\r\n    print (html_body % (options, content))\r\nUnicodeEncodeError: \'cp932\' codec can\'t encode character \'\\ufffc\' in position 2: illegal multibyte sequence\r\n'


line44 は該当ソースコードの最後の行です。

該当のソースコード

# coding: utf-8

import cgi
from datetime import datetime
html_body = """
<html><head>
    <meta http-equiv="content-type" content="text/html" /> </head>
<body>
  <form method="POST" action="/cgi-bin/f13form.py">
西暦を選んでください:<select name="year">
      %s
    </select>
    <input type="submit" />
  </form>
%s </body>
</html>"""
options=''
content=''
now=datetime.now()
for y in range(now.year-10, now.year+10):
    if y!=now.year:
        select=''
    else:
        select= "selected"
    options+="<option%s>%d</option>" % (select, y)
form=cgi.FieldStorage()
year_str=form.getvalue('year', '')
if not year_str.isdigit():
    content = "西暦を入力してください"
else:
    year=int(year_str)
    friday13=0
    for month in range(1, 13):
        date=datetime(year, month, 13)
        if date.weekday()==4:
            friday13+=1
            content+="%d年%d月13日は金曜日です" % ( year, date.month)
            content+="<br />"
    if friday13:
        content+="%d年には合計%d個の13日の金曜日があります" % ( year, friday13)
    else:
        content+="%d年には13日の金曜日がありません"
print ("Content-type: text/html\n")
print (html_body % (options, content))

補足情報(言語/FW/ツール等のバージョンなど)

windows10
python3.5.1
atom

を使っています。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

+4

\ufffc\u3099というキャラクターコードの文字が悪さをしているようです。

\ufffcのほうは「該当のソースコード」に表示されている「」です。
\u3099のほうは、合字(?)用の「濁点」です。こちらは見分けがつきません。

Atom上での操作ではこれらを上手く取り除くことができませんでした。
サクラエディタというテキストエディターで編集したところ、エラーをなくすことができました。

日本語の部分は何か特殊な方法で入力しているのでしょうか?
⇒これはコピペしただけですよね?


(追記)

みんなのPythonのページから直接コピーをして試してみましたが、再現しませんでした。

試したこと:Windows10のEdgeとFirefoxで、該当コードをAtomにコピペ。

具体的にどのような操作をしたか教えていただけると、何か分かるかも知れません。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/07/13 13:45

    濁音記号ということで utf-8-mac からの文字コード変換のような気がしますよね。\ufffcはいくつかの文字コード変換ツールで代替文字として使われているようです。

    キャンセル

  • 2016/07/13 14:15

    Lhankor_Mhyさん

    コメントありがとうございます。
    元記事はMacで書かれているのかも知れませんね。
    ページのHTMLを見てみると、ところどころ濁音記号(の合字?)が出てきます。
    ただ、コード部分はそうではないように見えるんですよね。

    キャンセル

  • 2016/07/13 14:57

    ご解答ありがとうございます。

    「該当のソースコード」の「」とはどれのことでしょうか?

    日本語の部分はサンプルコードのコピーを張り付けておりました。
    再度自分のatomで入力し直してみたのですがうまくいきませんでした。
    atomは使わないほうがいいのでしょうか?

    初学者のため理解が追い付かずすいません。

    キャンセル

  • 2016/07/13 15:05

    クロムで該当コードをコピーアンドペーストしました。
    元のサンプルコードは、print文に()を付けたり、uを外したり、encode("utf-8")を消したりとところどころいじりました。

    キャンセル

  • 2016/07/13 15:07

    TakumaSatoさん

    どうしてこういうことになったのかがまだ突き止められていませんので、
    まずお使いのWebブラウザーを教えてください。

    ブラウザーからAtomにコピペしたんですよね?

    > 「該当のソースコード」の「」とはどれのことでしょうか?

    ブラウザーが違うから見えないのかも知れません。
    私はFirefoxで見ていますが、html_bodyの各行の空白部分に特殊な記号が見えます。

    > 再度自分のatomで入力し直してみたのですがうまくいきませんでした。

    Atomだと一部分だけ消してもうまく行かないみたいです。
    1から全部入力しましたか?

    キャンセル

  • 2016/07/13 15:08

    http://coreblog.org/ats/stuff/minpy_web/04/02.html
    こっちのコードだと、ヒアドキュメント以外もutf-8-macになってる感じですね。

    ただ、エラーコードで cp932 のコーデックエラーが出てるのが解せませんね。utf-8 で文字コード指定してるのに print文の自動デコードで cp932 が出るのはなんでだろう?

    キャンセル

  • 2016/07/13 15:13

    Chromeがダメなのかも知れません。

    この質問のページを、
    他のブラウザー、EdgeかIEなどで開いてみて下さい。
    「該当のソースコード」の部分に変な文字が見えると思います。

    同様に、コピペするときもChrome以外のブラウザーで試してみて下さい。
    念のため、まっさらなファイルで試してください。

    キャンセル

  • 2016/07/13 15:25

    Lhankor_Mhyさん

    > こっちのコードだと、ヒアドキュメント以外もutf-8-macになってる感じですね。

    ホントだ。
    こちらからコピペしたのかもですね。


    > print文の自動デコードで cp932 が出る

    printでターミナルへの出力時に、
    cp932にデコードしているということなんじゃないかと思います。

    キャンセル

  • 2016/07/13 22:08

    IEで確認したところ、「該当のソースコードの変な文字」を確認できました。
    サンプルコードの「変な文字」をそのままコピペしていたようです。
    改めて打ち直したところ、無事に解決できました。

    お二方の親切な対応に感激しました。ありがとうございました。

    キャンセル

同じタグがついた質問を見る

  • HTML

    11446questions

    HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

  • Python 3.x

    9775questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • Unicode

    73questions

    Unicodeはエンコーディングの標準規格です。1つの文字コード体系で多国語の表現を可能にすることを目指して作られています。