C　アライメントに関して

Question

そもそもC言語のアライメントに関して本当に理解してやっている人はいるんですか？

理屈の話ではなく一般的にはx86CPUなら4バイト境界にアラインさせるのが一番効率がよいと言われています。
x86はメモリアクセスに寛容だから無理にアラインさせなくても一応アクセスは可能。
（逆に言うならばメモリの節約が可能）

メモリを節約しなければいけない状況
アクセス効率を重視する状況

などそれぞれの要件によってどのようにアライメントを揃えるかというのは変わってくると思います。

では、たまに見る

「2バイト整数は2の倍数のアドレスに配置・アラインさせる」

という記述は何ですか？

これは何を目的としたアラインのさせかたなんですか？

（まぁ、本当にアクセス効率を重視したいなら個々のアライメントというよりある程度の大きさのデータ配置を気にしたほうがいいのかな？）

[リンク内容](http://www5d.biglobe.ne.jp/~noocyte/Programming/Alignment.html)
![イメージ説明](a8b567b9196e099c0072c247696a650c.png)
CPU とデータ型によって異なるが
⇒これはわかる。

⇒つまり１バイト整数のアラインメントは１バイト， ２バイト整数のアラインメントは２バイト， ４バイト整数／単精度浮動小数のアラインメントは４バイト， ８バイト倍精度浮動小数のアラインメントは８バイトである．

一般って何？

理解力が低い私にはとてもじゃないけど理解できない記事でした。

Answer

まだ、閉じてないみたいなので、、

今、C言語とか、その他の高級言語でプログラムを書く時には、意識する必要のないものだと思います。VCだと、アライメントに合わせてメモリ割付けしてくれるし、特殊なパラメータ設定、または裏技でないと、不正な配置に置くことができないと考えています。

アライメントを考えるのは、少しでもメモリ効率を良くしようとか、少しでも速くなんて考える、または、組み込み系の非力なチップを使う時くらいではないでしょうか。そして、最近のPCで使われているチップ(Intel, ARM,...)では、キャッシュとか色々とあって、下手な(手作業の)最適化は、却って効率を落とすだけでしょう。

昔(20世紀)だと色々とありました。32bit CPUで、4byte整数を4byte境界に、合わせないとバスエラー例外とか、下位 2bitを無視してアクセスするCPUとか。byteアドレスと wordアドレスが違うものとか。(byte → word は、1bit シフト)

そういう意味では、(一般のアプリでは)アライメントを意識しなくても良い時代になったと思っています。

Answer

> maisumakun 2020/07/29 19:24
> x86でも、SSEを扱う場合には「16バイト境界にアラインする必要がある」ような場面も出現します。

コメントで埋もれてしまうにはあまりにももったいないので、SSEじゃなくてAVX2ですが、その事例をteratailの回答で書いたことがあったので、紹介しておきます。

[https://teratail.com/questions/140753#reply-213221](https://teratail.com/questions/140753#reply-213221)

ソースコードは上記回答にあるリンク先のgistを見てください。

AVX2命令は256ビットを一度に扱うもので、アライメントのサイズは32バイトです。アライメント調整のために動的にメモリ確保しているところは[aligned_alloc](https://ja.cppreference.com/w/c/memory/aligned_alloc)を使っているのがわかると思います。

> そもそもC言語のアライメントに関して本当に理解してやっている人はいるんですか？

理解していない人には、SSE等を扱うのは無理でしょう。ただ、CPUによって分岐を書く必要があったりするし、高パフォーマンスが必要になるライブラリ(例えば[libwebp](https://chromium.googlesource.com/webm/libwebp)等)以外は使っている人は少ないと思います。

Answer

> C言語のアライメントに関して本当に理解してやっている人はいるんですか？理解してる人はたくさんいると思いますよ。 > 理解力が低い私にはとてもじゃないけど理解できない記事でしたそう言われれば、プログラマが理解していなくてもそれほど困らない事かもしれませんね。なぜなら**アラインするのはCコンパイラ**ですから。プログラマが知らない間にコンパイラは全ての変数を適切にアラインしてくれています。あなたがアラインメントを知らないばかりにプログラムが動かなかった、なんてことはなかったはずです。まずはご安心を。でも時々、コンパイラがどうアラインするか、意識することがあります。それは構造体を使う時です。次のコードをコンパイルして動かしてみてください。 ```C #include #include //#pragma pack(4) // <= 試せるなら struct A { double d; // 8 float f; // 4 int32_t a; // 4 int16_t b; // 2 int16_t c; // 2 }; struct B { int32_t a; double d; int16_t b; float f; int16_t c; }; int main(void) { printf("A: %ld bytes. ", sizeof(struct A)); printf("B: %ld bytes. ", sizeof(struct B)); return 0; } ``` struct A と struct B はどちらも同じメンバ変数を持っていますが、並べた順序が違います。私の手元で実行すると、結果はこうでした。 ```bash # ./a.exe A: 24 bytes. B: 32 bytes. ``` もしアラインメントが一切無いなら両方同じバイト数になりますが、そうはならない。メンバ変数の並びが違うので、それぞれのメンバをアラインした結果、 struct B には struct A よりも隙間が多くなったのです。質問者もお手元で確かめてください。私の場合、違いは8バイトです。構造体一個のサイズが8バイト違っても大勢に影響は無いでしょう。なにせ今時のパソコンはGBオーダーのメモリを積んでますから。でも構造体を配列にしたら、その差は拡大します。例えば要素数1000の配列なら、違いは8000バイトです。それだけメモリが無駄になってしまいます。組込みの世界では今だってメモリサイズの制約が大きいので、こうしたことに敏感です。構造体のメンバ変数は、プログラマが書いた通りに配置されます（Cコンパイラはメンバ変数の順序を変えない）ので、ここの順序はプログラマの責任です。気にするのは当然でしょう。 >「2バイト整数は2の倍数のアドレスに配置・アラインさせる」という記述は何ですか？上のコードには int16_t 型のメンバ変数 b, c を含めました。b, c は２の倍数アドレスにアラインされるので二つ続けて並べれば、隙間なく配置できる＝隙間を減らせるというわけです。念のため繰り返しますが、アラインメントを理解できなくてもCプログラムを動かすことに大きな支障はないと思いますし、気にしなくて済む分野のソフトウェアはいくらでもあります。

Answer

> 「2バイト整数は2の倍数のアドレスに配置・アラインさせる」 

メモリアクセスの効率を良くする(というよりは悪くしない)ではないですか?
16bitとか32bitのデータバス幅でアクセスしているなら、奇数アドレスに始まる16bitデータは物理メモリにアクセスが2回必要になる可能性があります。偶数アドレスで始まっていれば確実に1回でアクセスできます。

(余談)8088はこの仕様で"やっぱり8bitマイコン"だなぁ、と思わせたものでした。

Answer

アライメントは、CPUのバス幅やアーキテクチャにより変わるもんです

＃組み込み向けなどのメモリが制限されてる環境なんかでは、アライメント意識しないと、まともに動かすことはできませんな。