質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.59%
C

C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

UTF-8

UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

Q&A

解決済

2回答

655閲覧

UTF-8の文字列をC言語で表示したい

Alyn

総合スコア50

C

C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

UTF-8

UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

0グッド

0クリップ

投稿2023/08/05 13:46

編集2023/08/05 15:45

実現したいこと

C言語でUTF-8の文字列をバイナリから出力したいです。
例えば「E3 81 82」が「あ」になりますので、配列「に0xE3, 0x81, 0x82, 0x00」と格納して、
printf()関数のような何かで出力させたいです。
実現方法を教えてください。
よろしくお願いいたします。

該当のソースコード

c

1#include <stdio.h> 2#include <inttypes.h> 3#include <wchar.h> 4 5int main() 6{ 7 char moji1[] = { 0xE3, 0x81, 0x82, 0x00 }; 8 char moji2[] = "あ"; //Shift JIS (82 A0) 9 10 printf("%s\n", moji1); 11 printf("%s\n", moji2); 12 13 return 0; 14}

追記

UTF-8のデータからShift JISのデータに変換する方法があればそちらをお願いいたします。

解決後のソースコード

c

1#include <stdio.h> 2#include <inttypes.h> 3#include <wchar.h> 4#include <string> 5 6std::string UTF8toSjis(std::string srcUTF8) 7{ 8 //Unicodeへ変換後の文字列長を得る 9 int lenghtUnicode = MultiByteToWideChar(CP_UTF8, 0, srcUTF8.c_str(), srcUTF8.size() + 1, NULL, 0); 10 11 //必要な分だけUnicode文字列のバッファを確保 12 wchar_t* bufUnicode = new wchar_t[lenghtUnicode]; 13 14 //UTF8からUnicodeへ変換 15 MultiByteToWideChar(CP_UTF8, 0, srcUTF8.c_str(), srcUTF8.size() + 1, bufUnicode, lenghtUnicode); 16 17 //ShiftJISへ変換後の文字列長を得る 18 int lengthSJis = WideCharToMultiByte(CP_THREAD_ACP, 0, bufUnicode, -1, NULL, 0, NULL, NULL); 19 20 //必要な分だけShiftJIS文字列のバッファを確保 21 char* bufShiftJis = new char[lengthSJis]; 22 23 //UnicodeからShiftJISへ変換 24 WideCharToMultiByte(CP_THREAD_ACP, 0, bufUnicode, lenghtUnicode + 1, bufShiftJis, lengthSJis, NULL, NULL); 25 26 std::string strSJis(bufShiftJis); 27 28 delete bufUnicode; 29 delete bufShiftJis; 30 31 return strSJis; 32} 33 34int main() 35{ 36 char moji1[] = { 0xE3, 0x81, 0x82, 0x00 }; 37 char moji2[] = "あ"; //Shift JIS (82 A0) 38 char result[10]; 39 40 std::string ret = UTF8toSjis(moji1); 41 int len = sizeof(ret) / sizeof(string); 42 43 for (int i = 0; i < (len * 2); i++) 44 { 45 result[i] = ret[i]; 46 } 47 48 printf("%s\n", moji1); 49 printf("%s\n", moji2); 50 printf("%s", result); 51 52 return 0; 53}

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

また依頼した内容が修正された場合は、修正依頼を取り消すようにしましょう。

jimbe

2023/08/05 14:19

>配列「に0xE3, 0x81, 0x82, 0x00」と格納して、printf()関数のような何かで出力 そのようなコードになっていると思うのですが、何が問題なのでしょうか。
Alyn

2023/08/05 14:23

以下のようにmoji1が文字化けして表示されてしまいます。 「縺・ あ」
guest

回答2

0

以下のようにmoji1が文字化けして表示されてしまいます。

SJISの端末にUTF-8の文字を出力しようとしたら化けて当然です。
端末をUTF-8に切り替えましょう。コマンドプロンプトなら、chcp 65001 と言うコマンドです。
切り替えると、UTF-8の文字が表示されて、SJISの文字が化けます。

投稿2023/08/05 15:58

otn

総合スコア83700

下記のような回答は推奨されていません。

  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

また依頼した内容が修正された場合は、修正依頼を取り消すようにしましょう。

0

自己解決

投稿2023/08/05 15:42

Alyn

総合スコア50

下記のような回答は推奨されていません。

  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

また依頼した内容が修正された場合は、修正依頼を取り消すようにしましょう。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.59%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

同じタグがついた質問を見る

C

C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

UTF-8

UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。