Unicode

Unicodeはエンコーディングの標準規格です。1つの文字コード体系で多国語の表現を可能にすることを目指して作られています。

RSS
  • 解決済

    回答
    4

    pythonで絵文字だけ取り除く方法

    python3のtkinterで、テキストウィジェットに文章を挿入しようとしたところ、 「ユニコードの基本多言語面(U+0000からU+FFFF)の範囲を超えています。tkinterでは扱いきれません。」といったエラーが出ました。 調べてみると、楓の葉の絵文字が混じっていたため、文章をinsertできなかったようです。 そこで、ある文章に先ほどの範囲を超

    • 0評価
    • 82PV
    KSwordOfHaste KSwordOfHaste 1日前に コメント
  • 解決済

    回答
    2

    スクレイピングした文字列を数値として格納するコードのエラー

    前提・実現したいこと スクレイピングした文字列を数値として格納しようとしています。 例えば、表示では「1,280」(文字列)となっているものを「1280」(数値)、またカンマのない「520」(文字列)も[520」(数値)として格納したいです。 可能性としてスクレイピング先の価格表示が「1,280円」もしくは「¥520」のように前後に円や¥がついている可能性が

    • 0評価
    • 99PV
    harunouta harunouta 3週間前に コメント
  • 解決済

    回答
    1

    RSSをスクレイピングする際に表示される文字コードエラーについて

    前提・実現したいこと ターミナルからPythonコマンドを実行することで、RSSをスクレイピングを行おうとしています。 発生している問題・エラーメッセージ 以下がスクレイピング実行例です。 >>> import feedparser >>> rss = feedparser.parse("http://www.shoeisha.co.jp/rss/i

    • 0評価
    • 77PV
    poko_poko poko_poko 4週間前に ベストアンサー
  • 解決済

    回答
    1

    u16Stringをchar型配列に入れたい

    u16Stringで宣言した文字列を、char型の配列に入れたいのですが char16_tの配列の長さがどうしても8になり、期待している動作になりません。 特にchar16_tの宣言の仕方が分かりません。基本的な仕様の誤解があるかもしれません。 ご指摘、ヒント等ありましたらご教授いただけると幸いです。 std::u16string str = u"aaa

    • 0評価
    • 122PV
    kamekawashinta kamekawashinta 1ヶ月前に 質問を編集
  • 解決済

    回答
    1

    【jQuery・Javascript】文字判定について

    現在Googleのwebサイト翻訳機能を使い、サイトを多言語対応しております。 対応している多言語は「英語・ベトナム語・タガログ語」です。 しかし、多言語に変換するとサイトが崩れてしまい、jQueryでタイトルの文字を判定し、英語なら読み込むcssを「english.css」に変更するという処理をしております。 英語の場合は「english.css」を読み込

    • 0評価
    • 234PV
    murama2 murama2 1ヶ月前に コメント
  • 解決済

    回答
    1

    スクレイピング時に文字コードの制御がうまくできない

    前提・実現したいこと ターミナルからPythonコマンドを実行することでスクレイピングを行おうとしています。 発生している問題・エラーメッセージ 以下がスクレイピング実行例です。下記のWebページから商品タイトルを取得しようとしていますが、文字化けが発生している状態です。ターミナルの文字コードはUnicodeにしています。 対象Webページ >>>

    • 0評価
    • 81PV
    harunouta harunouta 1ヶ月前に コメント
  • 解決済

    回答
    1

    UbuntuOSのバーチャルマシンで、Pythonのコードを実行する際のエラー

    前提・実現したいこと UbuntuOSのバーチャルマシンで、Pythonのコードを実行しようとすると以下のようなエラーが表示されて困っています。 発生している問題・エラーメッセージ UnicodeEncodeError: 'ascii' codec can't encode characters in position 13-19: ordinal no

    • 0評価
    • 66PV
    ranranway ranranway 1ヶ月前に コメント
  • 解決済

    回答
    1

    python unicodeや文字列について

    以下のような電子署名ファイルがあります、 ,†=‚oŸzýÈäkQ˜9É3ÛkÚþ‰.²§5(Ïé8}®9þ,«6³þ²ð<êjJ©9t·ÂÌ>5(^}y«y]÷3ÕÉælÐ&eñÂ~æ(³{tì¶á ²Бý‰£[ßÜ5G2 Š‡ƒK*=lÐ §èà§WRÕùÂþ)„•RðÛaטÔÈYóíÆ aZ³i4B”Êòê

    • 0評価
    • 88PV
    Tuang Tuang 2ヶ月前に コメント
  • 解決済

    回答
    3

    u16String表記のファイルをifstreamで開きたい

    C++でu16Stringを使ったファイル名で、ifstreamを作成したいのですが 文字コードの変換がうまくいかず、困っています。 どうしたらifstreamをu16Stringの日本語パス指定で使えるようになるでしょうか。 ご指摘、よろしくお願いします。 ※wstring_convertでchar16_tを引数にするのは避けます。理由はVS2015の

    • 0評価
    • 176PV
    Chironian Chironian 2ヶ月前に ベストアンサー
  • 解決済

    回答
    1

    pythonで英語のテキストファイルの編集、置換(unicord)

    pythonで英語のテキストファイルのなかにある日本語等(ユニコード文字)を削除しようとおもっているのですが、うまくいきません たとえば、\u3067がテキストファイルに書かれているとして \u3067を削除することはできます 削除自体は以下に示すように、空白と置換しています match2 = re.search("[a-zA-Z0-9.-\u3

    • 0評価
    • 151PV
    kohekoh kohekoh 2ヶ月前に コメント
  • 受付中

    回答
    1

    Python2.7での日本語テキスト処理

    Python2.7で以下のプログラムを使って日本語テキストを分割し、ファイル出力しようと思ったのですが、 # -*- coding: utf-8 -*- import os import sys import codecs sys.stdout=codecs.getwriter('utf-8')(sys.stdout) files=os.listdir

    • 0評価
    • 156PV
    TakumiYamada TakumiYamada 3ヶ月前に コメント
  • 解決済

    回答
    1

    複数codepointで一文字を表す可能性のあるcodepointの範囲は?

    前提:一文字の定義は http://unicode.org/faq/char_combmark.html#7 によると4つあるようですが、ここでは上記URLの4つ目、Grapheme clustersを指します。 combining characterのように一文字が複数のcodepointで表されることがありますが、そういった可能性があるcodepoi

    • 0評価
    • 157PV
    yumetodo yumetodo 3ヶ月前に ベストアンサー
  • 解決済

    回答
    3

    UWPアプリでの文字コードの取り扱い

    現在C#でWebAPIを叩くUWPアプリ開発をしております. 叩いているAPIはTwitterのもので,レスポンスのボディはUTF-8のjson形式となっております. 現在,コンソールアプリでは期待通りの結果が得られており,以下のコードにてアンエスケープまで完了した生のjsonデータが得られています. var client = n

    • 0評価
    • 282PV
    dodox86 dodox86 4ヶ月前に コメント
  • 解決済

    回答
    3

    pythonでus-asciiで書いてあるファイルを開きたい

    訳あってus-asciiで書かれたファイルをpythonで開く必要があるのですが、 file = codecs.open(filename,'r',encoding = 'us-ascii') file.read() と書いて、インタプリタで1行ずつ実行しても、file.readを実行した時点で unicodeDecodeError: 'ascii

    • 0評価
    • 158PV
    JyonstyK JyonstyK 4ヶ月前に 回答
  • 解決済

    回答
    2

    読み込んだ json が Unicodeエンコードされるのをデコードしたい

    やりたい事 jsonデータファイルを読み込んで変数に代入しているのですが、 Unicodeエンコード(?)されてしまうので デコードされた値を代入したいです。 やった事 test.jsonを [ [ { "タイトル": "お寺ている" }, { "コメント": "修行を積むのじゃ" }, { "備

    • 0評価
    • 150PV
    taro_nii_chan taro_nii_chan 5ヶ月前に ベストアンサー
  • 受付中

    回答
    4

    なぜasciiの空白だけ認識するのか

    phpのパターン修飾子であるxは、正規表現第三版438頁(日本語版)によるとASCIIの空白文字しか認識せずunicodeに含まれるそのほかの空白たちには認識しないそうです。 ここで初めて空白にも種類があるのか、と思ったので、調べてみるとASCIIの空白は、0x20がありました。 つまりxは、0x20の空白は認識するけれどもここの頁に記述してあるような空白た

    • 0評価
    • 244PV
    aaaaaaaa aaaaaaaa 5ヶ月前に コメント
  • 受付中

    回答
    1

    UnicodeEncodeErrorが抜けなくて困っています

    現在、python ver3.4.3を使いスクレイピングをしているのですが、 取得してきた結果の中にエラーが発生する文字があり、処理が出来ません。 文字コード変換に関する様々なサイトを見ていたのですが、悩んだ末いまだに解決できずにいます。もし分かる方がいらっしゃいましたら助けていただけないでしょうか。 処理しなければならない文字列に’ñ’などが含まれてい

    • -1評価
    • 180PV
    namnium1125 namnium1125 5ヶ月前に コメント
  • 解決済

    回答
    1

    Raspberry piで天気予報を実行したいのですがエラーが出てしまいます。

    前提・実現したいこと Raspberry piで天気予報を読み上げるというプログラムを実行したいのですがエラーがでて実行できませんでした。 リンク内容 上記のリンク先にあった通りプログラムを実行しました。 urllib2についてエラーが出たので以下のプログラムに書き換えています。 try: import urllib.request as

    • 0評価
    • 200PV
    Ras5 Ras5 5ヶ月前に ベストアンサー
  • 受付中

    回答
    1

    python3でのunicodedecodeerror

    前提・実現したいこと pythonでファイルを読み込もうとする際にunicodedecodeerrorが生じるのですが解決方法がわかりません 発生している問題・エラーメッセージ Traceback (most recent call last): File "d2v.py", line 46, in <module> lines = f.re

    • 0評価
    • 224PV
    can110 can110 5ヶ月前に 回答
  • 解決済

    回答
    1

    cloud9上におけるpythonウェブアプリの不具合について

    はじめて質問させていただきます。 プログラミング初心者にて知識も表現も拙いのですが、何卒よろしくお願いします。 python3のウェブアプリを作りまして、ローカルでは問題なく動作しているのですが、cloud9のレンタルサーバー上で動かそうとしたところ不具合がありました。 動作方法としてはcgi-binフォルダにpythonスクリプトを入れてcgiで動かし

    • 0評価
    • 257PV
    can110 can110 6ヶ月前に コメント
1

タグ情報

  • あなたの順位

    -

  • タグ登録者数

    21

  • 総質問数

    52

  • 今週の質問数

    1

関連するタグ

Unicodeタグのよく見られている質問

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る