質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
C

C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

C++

C++はC言語をもとにしてつくられた最もよく使われるマルチパラダイムプログラミング言語の1つです。オブジェクト指向、ジェネリック、命令型など広く対応しており、多目的に使用されています。

Q&A

解決済

3回答

7005閲覧

C/C++ 配列のインデックスとして使うべき型について

tails

総合スコア22

C

C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

C++

C++はC言語をもとにしてつくられた最もよく使われるマルチパラダイムプログラミング言語の1つです。オブジェクト指向、ジェネリック、命令型など広く対応しており、多目的に使用されています。

0グッド

0クリップ

投稿2020/07/18 12:36

質問

C言語、C++言語において配列のインデックスとして使うべき型は、size_t ですか?ptrdiff_t ですか?
すべてのインデックスが、ptrdiff_t 型で格納できる保証はありますか。

具体例

size_t

C

1#include <stddef.h> 2#include <stdint.h> 3#include <stdio.h> 4 5int main(void) { 6 unsigned char str[1000000]; 7 const size_t size = sizeof(str) / sizeof(*str); 8 9 for (size_t i = 0; i < size; ++i) { 10 str[i] = i; 11 } 12 for (size_t i = size - 1; i != SIZE_MAX; --i) { // 補足: i < size を好む人もいる 13 printf("%hhu ", str[i]); // 蛇足: 既定の実引数拡張があるから %u でいいの? 14 } 15}

ptrdiff_t

C

1#include <stddef.h> 2#include <stdint.h> 3#include <stdio.h> 4 5int main(void) { 6 unsigned char str[1000000]; 7 const size_t size = sizeof(str) / sizeof(*str); 8 9 for (ptrdiff_t i = 0; i < size; ++i) { 10 str[i] = i; 11 } 12 for (ptrdiff_t i = (ptrdiff_t)size - 1; i >= 0; --i) { 13 printf("%hhu ", str[i]); 14 } 15}

個人的な考え

結論 ptrdiff_t になるような気がしますが、そうなったとしても、

C

1typedef ptrdiff_t index_t;

とでもして、index_t を使うべきかなと思っています。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

ベストアンサー

size_t はオブジェクトのバイト数を表現するに足りる大きさを持つことになっています。 もちろん配列もオブジェクトであり、配列の大きさが配列のバイト数より大きいということはありませんから size_t がインデックスとして不足するということはありません。

一方で、 ptrdiff_t は一般的には size_t と同じ幅を持つものの、符号付きである分だけ表現可能な最大値は小さくなりますので表現不可能な場合が出てきてしまいます。 また、ポインタ同士の減算の結果を ptrdiff_t で表せなかった場合の結果は未定義であるということも明記されているので、そういう項目がある以上はそうなりうるということなんでしょう。

だた、常識的に言ってメモリ空間の半分以上をひとつのオブジェクトが占めるような状況はかなり特殊です。 インデックスは整数型であれば文法的には許容されるので使おうとしている配列の大きさを表せるだけの大きさがあれば十分です。 自分がやろうとしている状況に合わせて適切に見積もってください。

どういう状況で使われるのか想定しにくい汎用的なライブラリであればインデックスに使う型は size_t が間違いない方法ではあります。

投稿2020/07/18 17:54

SaitoAtsushi

総合スコア5684

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tails

2020/07/19 01:26

二つのポインタの減算の結果が ptrdiff_t で表現可能でない場合、その動作は未定義とする、という仕様が非常に残念ですね。 まあ仕方ないとも思いますが。 諦めて、size_t にします…
guest

0

C言語、C++言語において配列のインデックスとして使うべき型は、size_t ですか?ptrdiff_t ですか?

この状況では、理論的にはsize_tです。ptrdiff_t符号付きなので、「32ビット空間の4GiBメモリをすべてcharで確保した」というような極端な想定をすれば、後半が指せなくなってしまいます。

投稿2020/07/18 12:46

編集2020/07/18 12:53
maisumakun

総合スコア146018

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tails

2020/07/19 01:23

ptrdiff_t の仕様が残念ですね…
guest

0

intを使いますね。32bit環境では4GB付近までメモリを使いませんし。64bit環境ではsizeof(int) = 4なので巨大なデータを扱うときは要注意かもしれませんね。プログラムを見て思ったのですが、インデックスにこだわらずポインタをデクリメントしてみること、Cのmemset, memcpyなどを使うとCPUの拡張命令などを使って高速に演算できるのでそういったことにも気を使うといいのかと思いました。

C

1#include <stddef.h> 2#include <stdint.h> 3#include <stdio.h> 4 5int main(void) { 6 unsigned char str[1000000]; 7 const size_t size = sizeof(str) / sizeof(*str); 8 9 for (int i = 0; i < size; i++) { 10 str[i] = i; 11 } 12 for (unsigned char *p = str + (size - 1); p >= str; --p) { 13 printf("%hhu ", *p); 14 } 15}

投稿2020/07/18 15:09

anndonut

総合スコア667

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tails

2020/07/19 01:48 編集

今回はインデックスとして適切なものはどちらか、という質問なので、可読性を下げる高速なプログラムを書きたいわけではありません。 また、示されたコードは未定義の動作を含みますので、ご注意ください。(p = str - 1 を指すことになるのと、size == 0 の時に問題がある) ただ、インデックス操作よりもポインタ操作のほうがやはり高速なのでしょうか? 最適化によってインデックス操作はポインタ操作に置き換わるような気もしますが、その辺りと最適化との関連はどうなんだろう、と思います。 状況によるとは思いますが、あまりに可読性・移植性を犠牲にしてまで高速化に注力したくないです。
tails

2020/07/19 01:53 編集

あとは、インデックスとして int を使うことの是非ですが、ポインタに対して演算する際に、結局のところ、整数型はメモリ空間のアドレスサイズに拡張されるので、int がメモリ空間のアドレスサイズに対して小さければ、int を範囲内で制限させる分だけコストがかかるような気がしていましたが、単純なコードではアセンブリレベルで違いがみられませんでした。 なので、速度面からみれば特に問題なさそうではありますが、移植性の観点から見れば仕様上、int型は-32767から32767の範囲を保持できることしか保証がないため、これより大きいサイズをとる可能性があれば、int は問題があるかもしれません。
anndonut

2020/07/19 11:01

p = str - 1が正当かということについては、私も知りたいです。intについて言えば、組み込みでは大きな配列を扱わない、Windowsなどでは32bitなので問題ない、という認識です。配列のインデックスとしてsize_tを使うのが正当だとみなさん認識してはいるのでしょうが、for (size_t ...というのは少しばかり衒学的な印象を受けるので特段理由がない限りはintでよいのではないかと考えます。forのi++を++iと書くといかがなものかとまさかりを投げる人もいないことはないと思いますし…
tails

2020/07/21 10:37

JIS X 3010, 6.5.6 にあるように、 > (略)式Pが配列オブジェクトのi番目の要素を指している場合、式(P)+N及び(P)-N(Nは値nをもつと仮定する。)は、それらが存在するのであれば、それぞれ配列オブジェクトの i+n 番目及び i-n 番目の要素を指す。さらに、式Pが配列オブジェクトの最後の要素を指す場合、式(P)+1はその配列オブジェクトの最後の要素を一つ越えたところを指し、式Qが配列オブジェクトの最後の要素を一つ越えたところを指す場合、式(Q)-1はその配列オブジェクトの最後の要素を指す。ポインタオペランド及びその結果の両方が同じ配列オブジェクトの要素、又は配列オブジェクトの最後の要素を一つ越えたところを指している場合、演算によって、オーバーフローを生じてはならない。**それ以外の場合、動作は未定義とする。** とあるように、str - 1 という演算は、C99において未定義の動作だと読み取っています。 他に、p = str + 999999; ++p; は問題ないですが、p = str + 1000000; はNGみたいです。 郷に入ったら郷に従うことにします(笑) ただ、本当に理論上全く問題が起きないのは、size_t だというのは分かりました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問