質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.47%

  • 文字コード

    211questions

    文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

  • UTF-8

    112questions

    UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。

Shift-JISファイルをUTF-8Nに変換できない問題

解決済

回答 2

投稿 編集

  • 評価
  • クリップ 1
  • VIEW 4,321

mezzot

score 8

もともとShift-JISとして保存していた大量のHTMLファイルを諸事情でUTF-8へ書きかえることになりました。
UTF-8N (BOM無しのもの) として保存したいのですが、どのテキストエディタでも、再度開くとShift-JISに戻ってしまいます。デフォルトの設定はUTF-8Nですし、コピペで新しく保存しても同じ結果になります。
もちろんUTF-8 (BOM付き) としてなら保存できるのですが、アップロードの際にいちいち分別しなければなりません。

・なぜShift-JISのファイルがUTF-8Nにならないのか
・これらのファイルをUTF-8Nにする方法はあるのか

以上について、何卒よろしくお願いいたします。

追記
※Windows環境での作業になります
※使用エディタにTerapadもNotepad+++も使いました。ダメです…

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • yuba

    2016/03/25 13:54

    Windows環境での作業ということになりますか?

    キャンセル

  • mezzot

    2016/03/25 14:08

    はい、Windows環境での作業です。Macは備品がなく、使用できません。

    キャンセル

回答 2

checkベストアンサー

+2

もしかして、「日本語コードがほとんど(あるいはまったく)入っていない」テキストファイルを変換していないでしょうか。

シフトJISもBOMなしUTF-8も、ASCII文字列についてはまったく同じコード(ASCIIそのまま)ですので、識別ができません。とりわけ、真にASCII文字だけで書かれたテキストファイルであれば、シフトJISからUTF-8Nに変換しても、1バイトたりとも変化しません

ものによっては、「わざと日本語コメントを入れておく」のも一案かもしれません。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/03/25 14:41

    あ、この可能性が。

    キャンセル

  • 2016/03/25 14:57

    おっしゃる通り、日本語が全くないすべて欧文のテキストファイルになります。
    しかしながら、コメントアウトで日本語を入れるおまじないをしたところ文字化けしてしまいやはりSJISに戻るという謎事案が発生してしまったのでこの案はダメなのだと避けておりました。
    もう一度日本語を入れて試してみます! ありがとうございます。

    キャンセル

  • 2016/03/25 16:15

    maisumakun様、的確な御回答ありがとうございました。
    私もこれだと思います。いろいろと調べたところ、他にも例がございましてて、どうやらTerapadだとデフォルトをUTF-8Nにしていても上記のような理由でSJISと表示される仕様のようです。NotepadなどはデフォルトをUTF-8Nにしていればきちんとこちらで開けて編集できるようでしたので、最終的には「ASCII文字のみ」+「使用エディタ」の問題のようです。
    解決の見込みができましたのでこちらで最後にいたします。
    本当にありがとうございました!

    キャンセル

-1

Mac/Linuxなら、ターミナル/端末の「nkfコマンド」でできます。
Macなら「mi」というテキストエディタで簡単に文字コードを変更できます。
Windowsなら「Terapad」で文字コード指定保存ができます。
Windowsのターミナルで「chcpコマンド」を使えばできるっぽい…?

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/03/25 14:04

    Terapadで「文字コード指定保存」をしているのですが、これをしても再度開くとSJISに戻っているという謎現象なのです…

    >Windowsのターミナルで「chcpコマンド」を使えばできるっぽい…?
    大変ありがたい情報です。こちらで試してみて、結果をご報告したします。

    キャンセル

  • 2016/03/25 14:06

    ご報告いたします。他のテキストエディタでもそうなのですが、「UTF-8(BOM付き)」にはなります。しかし、UTF-8N(BOM無し)にすると、SJISに戻ってしまうのです……」
    Windowsのターミナルで「chcpコマンド」を使用する方法は、UTF-8にはなるようです…
    ありがとうございました

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.47%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • 文字コード

    211questions

    文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

  • UTF-8

    112questions

    UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。