質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
bash

bash(Bourne-again-Shell)は sh(Bourne Shell)のインプリメンテーションに様々な機能が追加されたシェルです。LinuxやMac OS XではBashはデフォルトで導入されています。

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

置換

置換とは文字列中の特定の文字に対して、別の文字列に置き換えることを指します。

Q&A

解決済

1回答

5146閲覧

linuxコマンドでの指定列・指定文字の置換

046Area_Dr_k

総合スコア1

bash

bash(Bourne-again-Shell)は sh(Bourne Shell)のインプリメンテーションに様々な機能が追加されたシェルです。LinuxやMac OS XではBashはデフォルトで導入されています。

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

置換

置換とは文字列中の特定の文字に対して、別の文字列に置き換えることを指します。

0グッド

0クリップ

投稿2020/08/31 08:39

前提・実現したいこと

linux shell上にてcsvファイルの置換に試みています。
囲み文字はダブルクォーテーション、区切り文字はカンマです。

"test1","tes*t2","test*3","test4","t*es*t5","test6" "TEST1","TEST2","TEST3","TEST4","T**EST5","TEST6"

上記のようなCSVファイルの5つ目のフィールドのアスタリスクのみを削除して以下のような姿にしたいです。

"test1","tes*t2","test*3","test4","test5","test6" "TEST1","TEST2","TEST3","TEST4","TEST5","TEST6"

該当のソースコード・試していること

sed -e '{s/,[*]//4}'

上記のような方法をいくつか試行錯誤していますが、どうも思い通りになりません。

何か良い方法があればご教授願いたいです。
よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hidezzz

2020/08/31 09:04

フィールド文字列の中にカンマ「,」が含まれる可能性はありますか?
046Area_Dr_k

2020/08/31 09:08

カンマが含まれる可能性はございません!
hidezzz

2020/08/31 09:12

了解です。私の回答はカンマが含まれる場合はうまくいかないのですが今回は問題なさそうですね。 gawkの場合は解決方法があるのでそれについては後で追記します。
046Area_Dr_k

2020/08/31 09:24

カンマがあるとだめなんですね。 承知しました。すみませんがよろしくお願いいたします。
guest

回答1

0

ベストアンサー

awkを使用して、第5フィールドに対してgsub関数で置換をかければ良いと思います。

awk

1$ awk 'BEGIN{ FS=OFS="," }{ gsub( "*", "", $5 ); print }' hoge.txt

実行結果です。

$ cat hoge.txt "test1","tes*t2","test*3","test4","t*es*t5","test6" "TEST1","TEST2","TEST3","TEST4","T**EST5","TEST6" $ awk 'BEGIN{ FS=OFS="," }{ gsub( "*", "", $5 ); print }' hoge.txt "test1","tes*t2","test*3","test4","test5","test6" "TEST1","TEST2","TEST3","TEST4","TEST5","TEST6"

※追記
「"」で囲まれた文字列の中には「,」が含まれていないとのことで今回は上のやり方で大丈夫ですが、
もし含まれている場合は、FSの代わりにgawkで追加された「FPAT」を使えば良さそうです。

以下ページを参考にしました。
GNU AWKでCSVファイルを楽々あつかう組込変数FPATと、関数のインダイレクト呼び出し (1/2):CodeZine(コードジン)

$ cat hoge.txt "test1,,","tes*t2","test*3","test4","t*es*t5","test6" "TEST1,,","TEST2","TEST3","TEST4","T**EST5","TEST6" $ gawk -v FPAT='([^,]+)|(\"[^\"]+\")' -v OFS=',' '{ gsub( "*", "", $5 ); print }' hoge.txt "test1,,","tes*t2","test*3","test4","test5","test6" "TEST1,,","TEST2","TEST3","TEST4","TEST5","TEST6"

投稿2020/08/31 08:59

編集2020/08/31 09:22
hidezzz

総合スコア1248

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

046Area_Dr_k

2020/08/31 09:06

hidezzzさん ご回答いただきありがとうございます。 ご教授いただいたやり方で実現できました! 当方ずっとsedコマンドのみで考えておりました。。 awkコマンドについてもこの先必要になると思うので勉強します。 ありがとうございました。
046Area_Dr_k

2020/09/07 05:00

hidezzzさん、お返事遅くなり大変申し訳ございません(通知が来なくて気づくのに遅れてしまいました)。 カンマがある場合の実装方法まで教えていただきありがとうございます。大変助かりました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問