質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
String

Stringは、ゼロ以上の文字から連続してできた文字の集合を扱うデータ型です。基本的にテキストを表すために使われます。

Unicode

Unicodeはエンコーディングの標準規格です。1つの文字コード体系で多国語の表現を可能にすることを目指して作られています。

UTF-8

UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。

ファイルI/O

ファイルI/Oは、コンピューターにおけるファイルの入出力です。これは生成/削除やファイルを読み込んだり、出力をファイルに書き込むようなディレクトリやファイルの運用を含みます。

C++

C++はC言語をもとにしてつくられた最もよく使われるマルチパラダイムプログラミング言語の1つです。オブジェクト指向、ジェネリック、命令型など広く対応しており、多目的に使用されています。

Q&A

解決済

3回答

2462閲覧

u16String表記のファイルをifstreamで開きたい

kamekawashinta

総合スコア39

String

Stringは、ゼロ以上の文字から連続してできた文字の集合を扱うデータ型です。基本的にテキストを表すために使われます。

Unicode

Unicodeはエンコーディングの標準規格です。1つの文字コード体系で多国語の表現を可能にすることを目指して作られています。

UTF-8

UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。

ファイルI/O

ファイルI/Oは、コンピューターにおけるファイルの入出力です。これは生成/削除やファイルを読み込んだり、出力をファイルに書き込むようなディレクトリやファイルの運用を含みます。

C++

C++はC言語をもとにしてつくられた最もよく使われるマルチパラダイムプログラミング言語の1つです。オブジェクト指向、ジェネリック、命令型など広く対応しており、多目的に使用されています。

0グッド

0クリップ

投稿2017/11/22 10:23

編集2017/11/22 10:25

C++でu16Stringを使ったファイル名で、ifstreamを作成したいのですが
文字コードの変換がうまくいかず、困っています。
どうしたらifstreamをu16Stringの日本語パス指定で使えるようになるでしょうか。
ご指摘、よろしくお願いします。

※wstring_convertでchar16_tを引数にするのは避けます。理由はVS2015のバグです。
https://connect.microsoft.com/VisualStudio/feedback/details/1348277/link-error-when-using-std-codecvt-utf8-utf16-char16-t

c++

1 2//abc.pdfだとうまくいく 3u16string utf16Str = u"C:\a\bbb\test_file\土壇場.pdf"; 4 5 6std::wstring_convert<std::codecvt_utf8<uint16_t>, uint16_t> utf8Conv; 7 8 9std::string utf8Str = utf8Conv.to_bytes(reinterpret_cast<const uint16_t*>(utf16Str.c_str())); 10 11 12 13std::ifstream fin; 14 15 fin.open(utf8Str, ios::binary); 16 17 if (!fin) 18 { 19//日本語ファイル名の場合のみfalseになる 20 cout << "false" << endl; 21 } 22 23

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

<codecvt>というヘッダー自体はC++17で非推奨となります。

ICUといった文字コード変換ライブラリを使うことが推奨されています。
ICU - International Components for Unicode

投稿2017/11/22 12:09

naohiro19_

総合スコア178

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Chironian

2017/11/22 13:28

なんと!! 「C++17で非推奨」は知りませんでした。情報ありがとうです。
guest

0

Unicodeを考えると泥臭いハックが必要です。なおすでに指摘があるように、C++標準での文字コード変換は事実上死んだので使用しないでください。

Windows

Visual Studio

std::basic_ifstreamのコンストラクタがconst wchar_t*を受け取る独自拡張があります。またchar16_twchar_tは同じバイナリ列なので単にポインタのキャストでいいです。

cpp

1u16string utf16Str = u"C:\a\bbb\test_file\土壇場.pdf"; 2 3std::wifstream fin(reinterpret_cast<const wchar_t*>(utf16Str));

その他のコンパイラ

VSのような独自拡張はないので、
そろそろWindowsでUTF-16とShift-JISの変換方法をC++erらしくまとめようか - Qiita
のようにWIN32APIを呼び出してCP932に変換しましょう。iconvでもいいですがその場合はshift_jisではなくcp932です、ご注意を。

Linux

やはりそのような拡張はないので変換が必要です。だいぶ前からLinuxはUTF-8なので、naohiro19_氏指摘のとおりicuなんかで変換してあげましょう。

投稿2017/11/22 12:56

編集2017/11/22 12:57
yumetodo

総合スコア5850

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

こんにちは。

微妙に異なるコードですがuint16_tではなくwchar_tで同様な処理をVisual Studio 2015でやった時はうまくいきました。あまり密なテストはしてないので「土壇場」だとダメという可能性はあります。

C++

1inline std::string convertUtf16ToUtf8(wchar_t const* iString) 2{ 3 std::wstring_convert<std::codecvt_utf8<wchar_t>, wchar_t> converter; 4 return converter.to_bytes(iString); 5}

後は、単に当該日本語ファイル名が微妙に違っている可能性もあるかも?
テキスト・ファイルへ変換後の文字列を出力して見ると良いかも知れません。


追記

ああ、思い出しました。Windowsのnarrow文字列はUTF-8ではなくShift-JISです。
ですので、UTF-8でオープンできません。

投稿2017/11/22 11:23

編集2017/11/22 11:26
Chironian

総合スコア23272

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kamekawashinta

2017/11/22 11:47

w_chartだとうまくいきそうですね。 ただ、申し訳ありませんが、wchar_tからではなく、u16stringからの変換を目指しています。 もしくは、wchar_tへの変換を噛ませるべきなのでしょうか?
kamekawashinta

2017/11/22 12:03

追記に関して fstreamに渡す場合、u16Stringを どこかでShift_Jisに変換する必要があるということですかね。
Chironian

2017/11/22 13:26

narrow文字列で処理する場合はその通りです。 yumetodoさんが書かれているように「std::basic_ifstreamのコンストラクタがconst wchar_t*を受け取る独自拡張があります。」を使うのが確実と思います。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問