質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
シェルスクリプト

シェルスクリプトは、UNIX系のOSもしくはコマンドラインインタプリタ向けに記述されたスクリプト。bash/zshといったシェルによって実行されるため、このように呼ばれています。バッチ処理などに使用されており、テキストファイルに書かれた命令を順に実行します。

grep

grepはコマンドライン上でテキスト検索を可能にするユーティリティーです。元はUnixのために用意されたものです。

sed

sedとは、POSIX環境のために作られたコマンドラインエディタです。sedは編集スクリプトの指示のもとに複数のファイルを編集し、標準出力にその結果を出力します。

シェル

シェル(shell)はUnix や Linux 系のOSで使用されるコマンドインタプリタを指します。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Q&A

解決済

1回答

1544閲覧

シェルスクリプトで、前半が英数字、後方が日本語の文字列から英数字文字列を取り出したい

rasum

総合スコア21

シェルスクリプト

シェルスクリプトは、UNIX系のOSもしくはコマンドラインインタプリタ向けに記述されたスクリプト。bash/zshといったシェルによって実行されるため、このように呼ばれています。バッチ処理などに使用されており、テキストファイルに書かれた命令を順に実行します。

grep

grepはコマンドライン上でテキスト検索を可能にするユーティリティーです。元はUnixのために用意されたものです。

sed

sedとは、POSIX環境のために作られたコマンドラインエディタです。sedは編集スクリプトの指示のもとに複数のファイルを編集し、標準出力にその結果を出力します。

シェル

シェル(shell)はUnix や Linux 系のOSで使用されるコマンドインタプリタを指します。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

0グッド

0クリップ

投稿2022/01/10 13:37

シェルスクリプトで、英数字で始まり、後ろの方に日本語が含まれているファイル名が各行に書かれたテキストファイルからファイルパスの英数字部分のみを取り出したいです。
日本語が出てきた部分から後ろは行末まで、拡張子も含め、すべて切り捨てたいです。
英数字部分にスペースなど特殊文字があれば、それも除外したいです。
ファイルに書かれたパスはすべて /DIR/ファイル名 となっていて、親ディレクトリは同じです。
/DIRの前にはパスに関係のない英数字・日本語が書かれています。これらは切り捨てます。

スペース・タブ・カンマ・ドット・非ascii文字[\x00-\x7F]を含まないとして、次の表現をしましたが何も返ってきませんでした。
grep -Po "/DIR/[^ \t,.\x00-\x7F]+"

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

/DIR/とそれに続く英数字だけを抽出したいなら

grep -o "/DIR/[a-zA-Z0-9]*"

でいいのでは?

難しく考え過ぎな気がします。

投稿2022/01/10 13:58

itagagaki

総合スコア8402

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

rasum

2022/01/10 22:47

itagaki様、ありがとうございます。 考えすぎでした。 ハイフン・下線は保持したかったので、下記で解決しました。 grep -Po "/DIR/[\-_a-zA-Z0-9]*"
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問