変数の型とCPUの関係

Question

変数の型とCPUの関係についてです。
何度か質問しているのですが・・・どうも理解できません。
頭が痛いです。

int型を例に取りましょう。
自分の環境では、int型4バイトです。
8bit = 1byteとします。

int型のサイズは処理系依存と言われます。しかし、この処理系依存という言葉・・・具体的に何を指しているんだろう？という疑問があります。
CPUやOS,コンパイラ・・・etc.

「組み込み現場のC言語」という本には
> int型のサイズはビット長はレジスタ長に依存する

とあります。つまりCPUですね。

[[C++] intのサイズはコンパイラやプロセッサに依存しますか？ ](https://code.i-harness.com/ja/q/239467)

> 16ビットマシンでは、sizeof（int）は2バイトでした。 32ビットマシンはint場合4バイトです。 intサイズはプロセッサのネイティブサイズ、つまりレジスタのサイズであると考えられています。 しかし、32ビットコンピュータは非常に人気があり、32ビットプログラミングモデル用に膨大な数のソフトウェアが作成されています。 したがって、64ビットコンピュータがintために8バイトを持つなら、それは非常に混乱します。 LinuxとWindowsはともにint 4バイトのままです。


え？
つまり、現在はint型はCPUに依存したサイズではない・・・ということですよね？
「昔はint型のサイズはレジスタ長に依存していたよ。」
「でも今は違うよ・・・」
どうやっているのでしょうか？？ 
**ハードウェアに関係なく、OSやコンパイラはどのようにしてint型のサイズを決定しているのでしょうか？？**

int型のサイズがCPUレジスタ長に依存していないと、さらに問題が出てきます。
そう！ややこしいアライメントです。
[アライメントとか、ワード境界とか](http://www.ertl.jp/~takayuki/readings/info/no01.html)

int型のサイズがハードウェアではなく、OSやコンパイラによって随時変わるのであれば、アライメントもハードウェアとは関係無いということですか？？
そんなことは無いはずです。

アライメントは型のサイズごとに決められているはずです。
char = 1byte, int = 4byte
**となると・・・CPUのアーキテクチャやデータバス幅やレジスタ長もアライメントには関係ないことになりませんか？？**

なんか・・・変ですね。
意味不明です。

アライメントは変数の型によって異なる。
**では変数の型（int型やchar型）のサイズは何によって決定されているんでしょうか？？**

例えば、1byteの連続な列を４つまとめて、int型としたとしましょう。
ハードウェアでこれを行っているなら、OSが異なっていても、CPUが同じであれば、int型のサイズは変わらないはずですよね？
OSによって変わる・・・？　どういうことでしょうか？？
これはマズイですよね。
そうするとCPUごとに決められたアライメントもOSによって変わっちゃうってことですよね？
これでは読み書きの高速化には繋がらないような・・・気がしますが・・・

分かる方教えてください。
どこかにとんでもない勘違いをしている可能性があります。

[追記]
んんんん！！ああ！やっとわかったかもしれません。

「1byteの連続な列を４つまとめて、int型としたとしましょう。」
これがまさにアライメントなのですね！

つまり、４つの1byteなデータを連続して並べる事をアライメント・・・って言うんですね！
（間違っていたら教えてください。）

[データ型のアラインメントとは何か，なぜ必要なのか？](http://www5d.biglobe.ne.jp/~noocyte/Programming/Alignment.html#CompositeDataAlignment)
アラインされていないデータへのアクセスの蘭のを見てみると、４バイトデータXがバラバラの位置に配置されていますよね。

これを、**４つ連続に並べること**こそがアライメントなんでしょうか？？
（だとしたら、アライメントの理解を完全に間違っていたことになります。）

もしそうだとしたら・・・
いままで、こんなことを考えていました。
「４バイトのint型を連続に並べてint型のアライメントを2に小さくすれば、データを共有できるのでは？」←　これ不可能ですね。

４バイトint型のアライメントを2にすると、2個の1byteが連続で並び、その２つの組は連続であることは保証されなくなる。ということですかね。
int 4byte => [1byte][1byte][ 　 ][  　][1byte][1byte]
メモリレイアウトはこんな感じになるんですかね。

Accepted Answer

こんにちは。

> int型のサイズは処理系依存と言われます。しかし、この処理系依存という言葉・・・具体的に何を指しているんだろう？という疑問があります。
CPUやOS,コンパイラ・・・etc.

この場合はコンパイラです。ただ、複数の異なるCPUをサポートしているコンパイラの場合はCPUにも依存します。なお、この場合はOSには依存しません。そもそもC/C++コンパイラは基本的にはOSに依存しませんので。（でないとOSを記述することなんてできないでしょう。）

各変数のサイズやアライメントは、完全にコンパイラの設計者がそのポリシー（良心と言っても良いかも）に従って決定します。そして、その決定過程にハードウェアの制約は大きく影響します。大抵のコンパイラの設計者はコンパイルしたプログラムが高速に動作することを望みますから、ハードウェアの制約上 低速になってしまうような選択はあまりしないでしょう。（例外はあります。後述します。）

さて、64bitマシンのint型に32bitを選択するべきか64bitを選択するべきか悩ましいですね。でも、より高速になることを望むのであれば、無駄にメモリを使うよりなるべく無駄にしない方が高速です。
非常に多くのケースでint型は32bitあれば十分ですから、int型を32bitにするのはハード的にも妥当な選択ではないでしょうか？

> アライメントは型のサイズごとに決められているはずです。

そんなことはありません。単に多くのCPUで型のサイズで区切った配置にすると最もアクセス性能が上がるから、そのように決められる場合が多いだけです。
例えば、奇数アドレスに2バイト整数型を配置しても速度のペナルティが全くないCPUは存在します。8bit CPUはたいてい該当します。そのようなCPUでは2バイト整数型のアライメントが0であるコンパイラしか見たことないです。

ちなみに、8bit CPUのint型は私が見たことがあるコンパイラは皆16bitでした。16bit変数アクセスは8bit変数アクセスに比べると半分の速度ですが、流石に8bitでは役に使い物にならないという判断だろうと思います。

Answer

・・・やはり、アライメントの本質は、「整数倍の位置に配置されること」**ではない**ような気がします。
レジスタ長や、データバス幅はそもそもアライメントに深く関係する話では無いですよね。

・int型4byteは、1byteが４つ並んでいます。
[データ型のアラインメントとは何か，なぜ必要なのか？](http://www5d.biglobe.ne.jp/~noocyte/Programming/Alignment.html#WhatIsAlignment)
こちらのサイトにも書かれているのですが・・・この１byteがもし、メモリ上に離散的に存在していたら、メモリに何度もアクセスしなくてはならなくなり、速度低下を招くわけですね。

[アライメントとか、ワード境界とか](http://www.ertl.jp/~takayuki/readings/info/no01.html)

つまり・・・int型4byteをメモリ上で連続的に並ぶことを保証し、「2つの箱をまたぐような要求をしてはいけない」というアライメント制約をつけることがアライメントの本質のような気がします。

「整数倍に配置する。」や「２のべき乗」というのは、メモリを効率良く使うためのものですね。

例えば、32バイトを一度に読み込むことができるCPUがあったとして、int型4byteであれば、32バイトの中にキッチ収まります。
ところが、コレが奇数倍などになると、int型の個数が少なくとも１個は減ってしまいます。

メモリ容量の効率化すると、結果的に、CPUが一度に読み込めるint型の数を増やせることで高速化できる。
ということだと思います。

アライメントの本質は「int型4byteが離散的な位置にばらつかないこと」だと考えました。
整数倍に配置するというのは、おまけ・・・みたいな？
まぁ、こちらも重要ですかね。

レジスタ長やデータバス幅はCPUごとに異なっており、**レジスタ長とデータバス幅は一致するとは限らない**ので、これでアライメントを考えようとすると混乱します。

ほとんど無関係だと考えられます。
だって、アライメントって変数ごとに異なり、しかも任意のアライメントを指定できる。
一方、データバス幅はCPUを購入してから動的に変わったりはしないので、ここは無関係・・・と考えるべきですね。

Answer

int のサイズは、コンパイラの都合、でしかないです。
それ以上でも以下でもありません

Answer

> 「組み込み現場のC言語」という本には
>> int型のサイズはビット長はレジスタ長に依存する

組み込み現場はよく知りませんが、これは真である可能性があります。組み込みだと、対象物にも依るでしょうが、抽象的なロジックを書くと言うよりは、CPUを制御するというか、高級アセンブラ的な使い方をされることが多いのではと想像します。

一般には、他の回答の通り、処理系に依存します。
また、ターゲットCPUを指定してオブジェクトを生成できる場合は、同じ処理系でもターゲットCPUによって変えることも考えられます。

「アライメント」とは、普通は、「データを複数並べるときに、次のデータを隙間無く並べるのでなく、次のデータをなにかの倍数のメモリアドレスに配置すること」です。
目的はメモリアクセスの高速化なので、その観点からはこれはターゲットCPUによって変えるべきでしょう。
0番地から始まるnバイトデータと、1番地から始まるnバイトデータの読み書きが同じCPUクロック数で行えるなら、隙間を空ける必要はありません。

Answer

C 言語における int の定義は実装依存ですが、そこには「当該CPUにとって最も自然なサイズ」という了解があります。64bit CPU であっても、実際にプログラムで利用するにあたっては 32bit サイズがあれば十分であるため、int は 32bit とするのが一般的なのです。

アライメントは CPU アーキテクチャに依存します。
古くはモトローラの MC68000　（最初期のマッキントッシュ、日本では X68000 で採用されたり、アーケードゲームの基盤にも使われた）のように、大型コンピュータから発生した CPU については、厳密なアライメントが存在しました。これは「データバス幅の倍数になるようにアクセス境界を設定する」必要がありました。
※回路の設計上の話です
簡単に言うと、奇数アドレスからのアクセスができなかった（CPUが例外を発生させる）のです。
一方 Intel はもともと 4004 CPU から発展してきた経緯もあって、こういうアクセスを許容していました。

CPU も 16bit から 32bit になり、高速化のためにキャッシュを内蔵することが当然になり、メモリアクセスも進化しました。CPU からメモリアクセスすると、ある程度のブロックを一気に読み込んで（必要か不要かは別にして）、キャッシュに置くようになります（これが可能なようにメモリ自体の設計も変化しています）。こうなると今度は、キャッシュを効率的に使用するために、「キャッシュサイズに合わせる」というアライメントが設定されるようになります。
※これには利用できるメモリ量の増大により、詰めて容量を稼ぐよりはアクセス速度を速くするほうが重要になったからでもあります

関連した質問