grepでの正規表現検索について

http://orange-factory.com/sample/utf8/code3-ef.html
こちらのサイトを元に

$ grep -E '[ｱ-ﾝ]' hoge.txt

こちらの形で半角だけ検索したいのですが、全角カナもヒットしてしまいます。なぜでしょうか？

otn

2018/03/07 11:58

OSは何でしょう？

yoppy0066

2018/03/07 13:37

mac osx10.13.3になります。

otn

2018/03/10 16:45

locale コマンドを実行してみてください。Macにもあるかな？

yoppy0066

2018/03/11 04:11 編集

$ locale LANG="ja_JP.UTF-8" LC_COLLATE="ja_JP.UTF-8" LC_CTYPE="ja_JP.UTF-8" LC_MESSAGES="ja_JP.UTF-8" LC_MONETARY="ja_JP.UTF-8" LC_NUMERIC="ja_JP.UTF-8" LC_TIME="ja_JP.UTF-8" LC_ALL= このようになりました。

otn

2018/03/12 12:03

不審な点は無いですね。うーむ。

a_saitoh

2018/03/13 02:25

「grep -E '[ｱ-ﾝ]」というスクリプトをファイルに書いて、odなりhd(あるかな？)コマンドで半角のアとンの文字コードが本当にHalfwidth Katakana variants（U+FF65〜FF9F）になっているかどうか確認してみてはどうでしょうか。凝れ、本来は-Eオプションは不要ですよね

yoppy0066

2018/03/13 08:06

ありがとうございます。ｱとﾝを含むテキストファイルをｱ=efbdb ﾝ=efbe9dとなり、grepをshファイルにしたものも見て見ましたが、同じものが使われているようでした。。。od -avtx1 -Ad a.txt みたいな形で確認しました。

yoppy0066

2018/03/13 08:12

grep [ｱｲｳｴｵｶｷｸｹｺｻｼｽｾｿﾀﾁﾂﾃﾄﾅﾆﾇﾈﾉﾊﾋﾌﾍﾎﾏﾐﾑﾒﾓﾔﾕﾖﾗﾘﾙﾚﾛﾜﾝ]だと、意図した動きになるので何か私が勘違いしているのでしょうか。。？

yoppy0066

2018/03/13 08:16

http://orange-factory.com/sample/utf8/code3-e3.html どうやら、こちらの表のコードが合致している感じでした。。何が違うのだろう。。

yoppy0066

2018/03/13 08:18

いや。。全角と半角ですね。。なんか混乱しています。すみません。。。

yoppy0066

2018/03/13 08:32

ggrep '[ｱ-ﾝ]'で解決しました。。

yoppy0066

2018/03/13 08:53

bsd grepでは日本語＋正規表現が使えないということでしょうか。。？

a_saitoh

2018/03/14 02:46

コマンドラインから直接打つのではなく、シェルスクリプトファイルにしてから実行したらどうなりますか？どうもMacOSはコマンドラインに直接日本語を打ち込むとUTF-8ではないエンコーディングになるみたいなことを書いたWEBページがありました。

yoppy0066

2018/03/14 02:53

ありがとうございます。シェルスクリプトから実行しても上手くいきませんでした。。

otn

2018/03/17 23:32

現象が発生するデータを含めたコマンド全体を示してください。

行動規範の内容に同意します

回答2件

使用するgrepにもよるようです。Macに標準で入っているgrepではだめでしたが、homebrewで入れたgnu grepではOKでした。(ロケールはja_JP.UTF-8です)

console
1% (echo 1ア; echo 2ｱ) | grep -E '[ｱ-ﾝ]'
21ア
32ｱ
4% grep --version
5grep (BSD grep) 2.5.1-FreeBSD
6% (echo 1ア; echo 2ｱ) | ggrep -E '[ｱ-ﾝ]'
72ｱ
8% ggrep --version
9ggrep (GNU grep) 3.3
10Packaged by Homebrew
11Copyright (C) 2018 Free Software Foundation, Inc.
12License GPLv3+: GNU GPL version 3 or later <https://gnu.org/licenses/gpl.html>.
13This is free software: you are free to change and redistribute it.
14There is NO WARRANTY, to the extent permitted by law.
15
16Written by Mike Haertel and others; see
17<https://git.sv.gnu.org/cgit/grep.git/tree/AUTHORS>.