質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.34%

  • C

    3983questions

    C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

C言語 fgetsで半分に切れてしまった2バイト文字を判定し、出力させないようにする方法

解決済

回答 3

投稿

  • 評価
  • クリップ 0
  • VIEW 213

Alyn

score 15

 実現したいこと

fgetsで文字をオーバーフローせず出力するものを作ってみたのですが、「aあああああ」と入力すると「 aああああ・」となってしまいます。
この"・"のような2バイト文字が半分に切れてしまった文字を判定し、出力させないようにするにはどうしたらよいでしょうか?

 ソースコード

#include <stdio.h>
void main()
{ 
    /*--------変数・配列の宣言--------*/
    int iCount  = 0;                                                                        /* 入力した文字数を数える変数 */
    char cBuffer[200] = {'\0'};                                                                /* 入力した文字を出力するための配列 */

    printf("1_文字列を入力し、その文字列をそのまま出力します。\n");

    printf("文字列を入力:");

    /*--------文字列の入力--------*/
    fgets(cBuffer, 11, stdin);

    /*--------NAL文字を配列の最後にする--------*/
    while(cBuffer[iCount] != 0x00)
    {
        if(cBuffer[iCount] == 0x0a)
        {
            cBuffer[iCount] = 0x00;
            putchar('\n');                                                                    /* 改行 */
            break;
        }
        iCount++;
    }

    /*--------文字列の出力--------*/
    printf("入力した文字列は「 %s 」です。\n", cBuffer);                                /* 入力した文字列を出力 */
}
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 3

checkベストアンサー

+1

おそらく文字コードはSJISと思われるので、その前提で。
全角文字は2バイト構成で1バイト目は0x81~0x9f 0xe0~0xef の範囲と決まっています。
参考
文字コード表 シフトJIS(Shift_JIS)

なので文字列の末尾の文字コードがこの範囲であればNULLに置き換えてあげれば文字化けはなくなります。
単純に書くなら最後のprintfの前に以下のコードを足してください。
但しcBufferの定義をcharからunsigned charに変更することをお忘れなく。
またstring.hのインクルードも追加してください。

    int n;
    n = strlen(cBuffer) - 1;
    if((0x81 <= cBuffer[n] && cBuffer[n] <= 0x9f) || (0xe0 <= cBuffer[n] && cBuffer[n] <= 0xef)){
        cBuffer[n] = 0x00;
    }

    /*--------文字列の出力--------*/
    printf("入力した文字列は「%s」です。\n", cBuffer);                                /* 入力した文字列を出力 */

もしVisualStudioをお使いなら_ismbblead関数が使えると思うので、そちらを使ったほうが楽と思います。
https://msdn.microsoft.com/ja-jp/library/3hd1xf60.aspx

訂正
皆さんの回答より1バイト目のみ判定では不完全であることがわかりました。
私の中途半端な知識でご迷惑をおかけしました。
やはり先頭から順に見ていく必要があるということで、判定処理を考えてみました。

    unsigned char *p = cBuffer;
    int f = 0;
    while(*p != 0x00) {
        if(f == 2){
            f = 3; // 全角2バイト目
        } else
        if((0x81 <= *p && *p <= 0x9f) || (0xe0 <= *p && *p <= 0xef)){
            f = 2; // 全角1バイト目
        } else {
            f = 1; // 半角
        }
        p++;
    }
    if(f == 2){
        *(--p) = 0x00;
    }

    /*--------文字列の出力--------*/
    printf("入力した文字列は「%s」です。\n", cBuffer);                                /* 入力した文字列を出力 */

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/07/30 11:36

    とても親切に回答をいただきありがとうございました!

    キャンセル

  • 2018/07/30 12:19

    SHIFTJISは第2バイトが40-7Eならびに80-FCなので、あるバイトだけを見て1バイトめか2バイト目かを判断することができません。cBufferの先頭から順にみていく必要があると思いますよ。

    キャンセル

  • 2018/07/30 14:48

    第2バイトが0x81~0x9fまたは0xe0~0xefの文字ってありますか?

    キャンセル

  • 2018/07/31 12:38

    全角の「=」は0x8181ですね。

    キャンセル

0

既に解決済みのようですが、、、。

第2バイトが0x81~0x9fまたは0xe0~0xefの文字ってありますか?

MS-IME より、
0x81-0x9F

0xE0-0xEF

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

-1

ShiftJISなら、全角文字の1バイト目、というのが判定できるので、その1バイト目しかないデータを削除/表示しないようにすればいいです

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/07/30 10:41

    どのように判定するのですか?

    キャンセル

  • 2018/07/30 10:42

    「shiftjis 1バイト目」とかでぐぐると解説が出てきます

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.34%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • C

    3983questions

    C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

  • トップ
  • Cに関する質問
  • C言語 fgetsで半分に切れてしまった2バイト文字を判定し、出力させないようにする方法