質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.91%

awkのコマンドの意味がわからない

解決済

回答 2

投稿 編集

  • 評価
  • クリップ 1
  • VIEW 1,407

imamoto_browser

score 1086

下記コマンドの意味が分からなくて困っています。

awk '{a[$1FS$2]=a[$1FS$2]FS$NF} END {for(i in a) print i a[i]}' file.txt

file.txt

  A 123 BC
  A 123 DD
  A 123 TT
  B 456 AA
  B 456 RR
  C 789 EE
  A 123 GT

特に、{a[$1FS$2]=a[$1FS$2]FS$NF}がよくわからないのですが、NFはフィールド数、FSはデフォルトのセパレータなので空白スペースだと認識しているのですが、なぜ、それで結果が

A 123 BC DD TT GT
C 789 EE
B 456 AA RR

となるのでしょうか。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • SugiTK

    2017/05/24 19:49

    うちの awk では違う結果になりました。file.txt は合ってますでしょうか?

    キャンセル

回答 2

checkベストアンサー

0

スクリプトは第一第二フィールドを空白を挟んで連結した文字列をキーとした連想配列を使ってますので、第一第二フィールドが共通な行について最後のフィールドを連想配列aの要素として連結していくという意味になります。NFは常に3になります。そのため$NFは$3すなわち3番目のフィールド=最後のフィールドという意味になります。

ENDではaのキーを取り出してそのキーの要素をキーとともに印字しているだけです。

どこが腑に落ちないか今一つはっきりしませんが、aが連想配列であるという点に気づかれてないのだろうと推測しました。

例えば最初の行は次のような雰囲気で実行されます。

a['A 123']=a['A 123']" BC"

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/05/25 06:38

    ここでのENDはlinuxでいうパイプのような役割と考えてよいのでしょうか。BEGINは必須ではないということですよね?

    キャンセル

  • 2017/05/25 08:14

    かなり違います。パイプなら前段のコマンドと並行して後段が同時に動きます。awkのENDは入力行の処理が全て終わった後で(入力をEOFまで処理し終わった後で)実行されます。

    キャンセル

  • 2017/05/26 17:03

    なるほどフックされるタイミングがちがうというわけですか。awkは使い倒して慣れていくしかないですね。

    キャンセル

  • 2017/05/26 17:11

    大抵は「awkとはこういうもの」という肝心な点だけ押さえておいて、実際に使う機会が来た時に細かな点を覚えるのが一番頭に入ると思います。自分はlinuxのコマンドを端から端まで全部覚えていられるほど記憶力はよくないので、知りたくなった時に調べるようにしています。

    キャンセル

0

http://lagendra.w3.kanazawa-u.ac.jp/ogurisu/manuals/awk/intro/node26.html

こちらの解説を読むと理解できるかと思いますがいかがでしょうか。
NF と $NF は違いますのでご注意ください。

file.txt はこの内容が正しそうですね。

A 123 BC
A 123 DD
A 123 TT
B 456 AA
B 456 RR
C 789 EE
A 123 GT

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.91%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る