質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.77%

(LPWORD)が必要な理由

解決済

回答 5

投稿

  • 評価
  • クリップ 0
  • VIEW 823

mery

score 26

前提・実現したいこと

エディットボックスから特定の行の文字列を取得する方法を調べていたらエディットボックスにEM_GETLINEを送信すればいいという情報を見つけました。
その内容によると文字列を受け取るバッファの先頭2バイトにバッファのサイズを指定しておく必要があると書いてあり、その部分のソースコードは下のようになっていたのですが、(LPWORD)がなぜ必要なのか理由がわかりません。
試しに(LPWORD)を削除し*szBuf = sizeof(szBuf) / sizeof(TCHAR);として実行してみましたが実行結果は何も変わりませんでした。
この(LPWORD)は何をするためのものなのですか?

該当のソースコード

TCHAR szBuf[256];
*(LPWORD)szBuf = sizeof(szBuf) / sizeof(TCHAR);

補足情報(FW/ツールのバージョンなど)

Microsoft Visual C++ 2010 Express C言語
WIN32 ユニコードビルド Windows7

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 5

checkベストアンサー

+5

余談ですが、このキャストは安全ではないです。
ref:
(翻訳)C/C++のStrict Aliasingを理解する または - どうして#$@##@^%コンパイラは僕がしたい事をさせてくれないの! - yohhoyの日記

やるとしたら

TCHAR szBuf[256] = { 0 };
const WORD size = (WORD)(sizeof(szBuf) / sizeof(TCHAR));
memcpy(szBuf, size, sizeof(size));

じゃないでしょうか。


なんか無駄に回答者が多くついている割に、質問者の理解に繋がっていないようなので、真面目に回答します。

仮にTCHARcharだとしましょう。

TCHAR szBuf[256];
*(LPWORD)szBuf = sizeof(szBuf) / sizeof(TCHAR);

szBufTCHAR [256]型の変数です。C言語では配列は3つくらいの例外を除いて式中では常に配列の先頭要素へのポインタとして扱われるのでした。

ポインタ型はつねにもととなる方があってそこから派生して作られます。

int n = 0;
int* np = &n;

この例ならnpの型はint*型ですが、これはint型から派生してできますよね?

これは何を意味するかと言うと、pointerをdereferenceするときに(=たぐり寄せたとき)、メモリーをどう扱えばいいかを示すのが派生元の型である、ということができます。この例ではnpをdereferenceしたときの領域の大きさ、bitの使われ方はint型と同じだよ、といううのがint*型の意味ですね。

TCHAR szBuf[256];
*(LPWORD)szBuf = sizeof(szBuf) / sizeof(TCHAR);

さて、本題に戻りましょう。この配列(=szBuf)の先頭要素へのポインタをLPWORD型(=WORD*型=16bitの符号なし整数型へのポインタ型)にキャストするというのはどういうことかというと、メモリーをどう扱えばいいかを偽る、という作業になります。配列szBufのメモリー領域は本当はTCAHRの配列ですが、WORD型の変数であると偽るわけです。

メモリー

では質問者さんがいう

まだよくわからないのですが、szBuf[0]からszBuf[256]までの要素のそれぞれを2バイトの領域として扱い、szBuf[0]にsizeof(szBuf) / sizeof(TCHAR)の結果を保存するという意味であってますか? 

は誤りなのでしょうか?じつはあながち間違いでもありません。(szBuf[256]じゃなくてszBuf[255]でしょうが、ケアレスミスですよね?)

Re:Cのポインタと配列の関係について考察してみる
を読んでいただきたいのですが、ポインタは単にdereferenceして指し示す先を取り出すだけではなくて、ポインタ演算によってポインタの指す場所を移動させる、イテレータのような機能も持つのでした。

int n1 = 3;
int arr[2] = { 0 };
int* p;
p = &n1;//OK
p++;//OK
p = arr;//OK
p++;//OK

言い換えるとint型は要素数1の配列とみなすこともできるわけです。というかポインタには要素数の情報がありませんので、上のコードのような芸当ができるのでした。

つまり、

szBuf[0]からszBuf[256]までの要素のそれぞれを2バイトの領域として扱い

は正しく直すと

要素数不明のWORD型の配列と偽る

となります。


で追記前に書きました話に戻ります。

先程

メモリーをどう扱えばいいかを偽る、という作業

と書きましたが、こういう作業はコンパイラがプログラムの最適化をしやすくするために、多くの場合で禁止されています。言い換えるとszBufは何も変更されないというコードをコンパイラが生成する可能性があるということです。

ではどうすればいいのか、細かい理屈は冒頭でリンクしていてこのコメント欄にも書き込みされている
yohhoyさんの記事を見ていただくとして、結論から言うとmemcpyでbyte copyすればよいです。念の為memcpyとは何をするものなのかman memcpyでぐぐって確認すると

https://linuxjm.osdn.jp/html/LDP_man-pages/man3/memcpy.3.html
memcpy() はメモリー領域 src の先頭 n バイトを メモリー領域 dest にコピーする。コピー元の領域と コピー先の領域が重なってはならない。重なっている場合は memmove(3) を使うこと。  

とあります。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/05/30 01:47

    言語仕様に厳格になるなら yumetodo さん対処コードの方が安全ですね。
    ただまあ(私が知る限りは)MSVCはStrict Aliasing Ruleを考慮しない=同規則に基づく積極的な最適化をしないので、元々のコードで十分動く気はしますw

    キャンセル

  • 2019/05/30 02:23

    まあ動いちゃう気はしますw(それはそれでどうなんだ

    キャンセル

  • 2019/05/30 19:45

    yumetodoさん詳細な解説ありがとうございました。

    キャンセル

+2

ユニコードビルドだとTCHAR=WCHARなので、*(LPWORD)があってもなくてもバッファのサイズが格納される領域のバイト数は2バイトですが、マルチバイトビルドだとTCHAR=CHARなので、*(LPWORD)がないと、バッファのサイズは先頭1バイトのみに入ってしまいます。

どちらのビルドモードでも意図した結果になるようにLPWORDでキャストしているのでしょう。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/05/29 20:40

    回答ありがとうございました。
    マルチバイトビルドの時に*(LPWORD)がないと警告がでたのでその対策のようですね。

    キャンセル

0

windowsのTCHARはANSIとUNICODEで型が変化し
それぞれ、charwchar_tです。

というわけでcharの場合で実験すると

#include <stdio.h>

typedef unsigned short *LPWORD;

int main(){
    {
        char szBuf[256] = {0x11,0x11,0x11,0x11};
        *(LPWORD)szBuf = sizeof(szBuf) / sizeof(char);
        printf("%02x %02x %02x %02x\n", szBuf[0],szBuf[1],szBuf[2],szBuf[3]);
    }
    puts("------------");
    {
        char szBuf[256] = {0x11,0x11,0x11,0x11};
        *szBuf = sizeof(szBuf) / sizeof(char);
        printf("%02x %02x %02x %02x\n", szBuf[0],szBuf[1],szBuf[2],szBuf[3]);
    }
}

では出力される文字が変わります。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/05/29 20:10

    回答ありがとうございました。教えて頂いたコードを試した結果、キャストしない行があると「warning C4305: '=' : 'unsigned int' から 'char' へ切り詰めます。」という警告が表示されました。
    どうやらcharの場合にこの警告を出さないためのキャストのようですね。

    キャンセル

0

まずsizeof(szBuf) / sizeof(TCHAR)で求められるのは数値になりますから、格納先のTCHARとは型が異なります。
TCHARの領域に数値型を代入しようとしているので、通常ならWarningが出て注意されるので、代入先はTCHAR型ではなくWORD型として扱ってね、とやっているわけです。
LPWORD型はWORD型のポインタです。
WORD型はshort型ですから2バイトです。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/05/29 21:09

    szBufの先頭アドレスが指すのがszBuf[0]なんだからそこに続く領域のszBuf[1]からszbuf[256]もWORD型として扱われるんじゃないのですか?
    szBuf[0]だけが2バイトの領域になるとしたら、もしszBufをchar型で宣言していたらszBuf[0]が2バイトで残りの要素はそれぞれ1バイトの領域になるのでしょうか?

    キャンセル

  • 2019/05/30 02:22

    >ttyp03 氏

    別にあながちまちがってもいないような。ポインタはポインタ演算できるので(私の回答で大幅補足して言及しました

    キャンセル

  • 2019/05/30 08:51

    yumetodoさん>
    まあ間違っているとは思ってませんが、初学者に理解できるかなという点で難しいと感じました。
    特にC言語の場合、変数とメモリの関係を強く意識しないといけないわけで、そこの理解ができていないと通じない話なのかと思いました。

    meryさん>
    コンピューターにはメモリがあって、そこに変数の領域が割り当てられます。
    メモリ視点でみたときそこには単なる数値があって「型」が何かという情報は持っていません。
    C言語ではその領域を変数の型として持っていて、TCHAR型の情報として内部処理します、int型の情報として内部処理します、などなど、と定義しているにすぎません。
    なのでTCHARとして扱うと最初にいいましたけど、今だけはWORD型としてください、とお願いしていると考えてもらえれば伝わりやすいかな。
    どうでしょう。

    キャンセル

-2

まずは、LPWORDがどういう定義をされているか調べてみたらどうでしょう
それをまず理解しないことにはなぜ必要かわかりませんぜ

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/05/29 18:48

    回答ありがとうございました。
    調べてみたらLPWORDはunsigned short 型の別名のようですね。

    キャンセル

  • 2019/05/30 07:21

    16ビット整数のポインタにキャストしてるってことですんで、あとは他の回答のとおりですね

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.77%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る