編集履歴

回答編集履歴

C++20

2018/07/07 16:51

投稿

スコア5850

test CHANGED Viewed

@@ -108,6 +108,14 @@
+さて、C++20に向けて再び`char8_t`型が[提案されています](http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2018/p0482r1.html)。
+**もし`char8_t`型が標準入りしたならば、もはや`char`は使うべきではないと言えるでしょう。**
 ---

2018/07/07 16:51

投稿

スコア5850

test CHANGED Viewed

@@ -58,26 +58,26 @@
+|文字列リテラル|型|格納される物|
+|--|--|--|
+|`u8""`|`const char[]`|UTF-8|
+が追加されています。
+またC++17では
 |文字リテラル|型|格納される物|
 |--|--|--|
-|`u8""`|`const char[]`|UTF-8|
-が追加されています。
-またC++17では
-|文字リテラル|型|格納される物|
-|--|--|--|
 |`u8''`|`char`|UTF-8|

2018/07/07 16:44

投稿

スコア5850

test CHANGED Viewed

@@ -10,7 +10,7 @@
-とは **整数を格納する型として** と捉えるべきです。
+とは **整数を格納する型として** と捉えるべきです。文字列、ただし一単位が1byteな文字エンコードを格納する型としては、これまで通り`char`型を用いるべきです。
@@ -146,13 +146,13 @@
 と書かれているじゃないですか。プログラマーは怠惰であるべきなので、STLを使うほうが楽できます。STLの関数群/クラス群の使い方を調べるには
-[https://cpprefjp.github.io/(https://cpprefjp.github.io/)
+[https://cpprefjp.github.io/](https://cpprefjp.github.io/)
 が便利です(宣伝)
-ただしiostream系はC++の`std::cout`のようなスタイルやCの`printf`のようなスタイルともにアキラな問題が存在し、[fmtlib/fmt](https://github.com/fmtlib/fmt)とかを使うべきだということができます。またlocaleはだいたいC/C++問わずぶっ壊れていて使い物になりません
+ただしiostream系はC++の`std::cout`のようなスタイルやCの`printf`のようなスタイルともに明らかな問題が存在し、[fmtlib/fmt](https://github.com/fmtlib/fmt)とかを使うべきだということができます。またlocaleはだいたいC/C++問わずぶっ壊れていて使い物になりません

C APIと文字列

2018/07/07 16:42

投稿

スコア5850

test CHANGED Viewed

@@ -175,3 +175,59 @@
 C/C++にはUnicodeどうしの文字コード変換を行う方法が存在しないという状態が生じています(C++11で入ったが致命的な欠陥が見つかってC++17でdeprecated)
+---
+C APIで文字列を受け取る場合のAPI設計について留意するべきことがあります。
+Cだけやっていると
+```c
+void foo(char* str);
+```
+のようなAPIを作りがちですが、2つの点からこれをするべきではありません。
+1. 文字列の長さがNULL終端文字に依存している
+Cでは文字列とはNULL終端するbyte列のことでしたが、これはプログラミングをする上で余計なメモリ確保を強いる事があり、非効率的です。
+C++ですらC++17で`string_view`なるものが追加され、文字列の先頭へのポインタと長さの構造体のようなクラスを`std::string`と同じインターフェースで扱えるようになったことでNULL終端しない文字列を扱う機会が増えます。
+2. const修飾されていない
+const修飾されていないとC++ではこのAPIに文字列リテラルを渡すことができません。
+また文字列が書き換えられる可能性があるため安全のために一度動的メモリ確保を行いコピーするコストが発生し、著しく実行速度に影響を与えます。
+したがって
+```c
+void foo(const char* str, size_t len);
+```
+のようにしましょう。