特定正規表現にマッチしない文字を取得する方法(javascript)

Question

12:44 hogehogehogehoge

fogefogefoge 01:30

fogefoge 5:30 hogehoge


このような文字の中で`mm:ssにマッチする文字`と`マッチしてない文字`を取得したいです


mm:ssにマッチする文字は以下の方法で取れましたが、

```
const regex = RegExp("([0-6]?[0-9]):([0-6]?[0-9])");
const time = str.match(regex);
```

`マッチしてない文字`の取得方法は見つかりませんでした。
何かいい方法がありましたらご教示いただけますでしょうか

Accepted Answer

### 否定先読み

※`String#split` 版は必要なら、`Array#filter` で「空文字の要素」を除去。

```JavaScript
const string = `12:44 hogehogehogehoge
fogefogefoge 01:30
fogefoge 5:30 hogehoge`;

const result1 = string.split(/([0-5]?\d:[0-5]?\d)/),
      result2 = string.match(/[0-5]?\d:[0-5]?\d|(?:(?![0-5]?\d:[0-5]?\d)[\s\S])+/g);

console.log(JSON.stringify(result1)); // ["","12:44"," hogehogehogehoge
fogefogefoge ","01:30","
fogefoge ","5:30"," hogehoge"]
console.log(JSON.stringify(result2)); // ["12:44"," hogehogehogehoge
fogefogefoge ","01:30","
fogefoge ","5:30"," hogehoge"]
```

### 文法規則

ざっくり書きましたが、本来は例えば、下記文字列に**部分一致**しても良いのか、をしっかり考えて正規表現を書くのが正道です。

```JavaScript
console.log('111:222:333:444'.match(/([0-5]?\d:[0-5]?\d)/g)); // ["11:22", "2:33", "3:44"]
console.log('1:2:3:4'.match(/([0-5]?\d:[0-5]?\d)/g));         // ["1:2", "3:4"]
console.log('23:35:49'.match(/([0-5]?\d:[0-5]?\d)/g));        // ["23:35"]
```

この場合、「マッチしない文字列」でこれらを消費してしまえば、「マッチさせない文字列」として扱う事が可能ですが、

- 「マッチする文字列」の文法規則
- 「マッチしない文字列」の文法規則

はそれぞれ独立して定義するので、「マッチする文字列」から「マッチしない文字列」の正規表現が自動的に決定されるものではありません。
「先読み」「後読み」を駆使すれば、自動的に決定する完璧な「マッチする文字列の正規表現」が実現できなくもないですが、「後読み」の実装が不安定です。

```JavaScript
const fix1 = string => string.match(/\D*(?:\d+(?::\d+){2,}|(?![0-5]?\d:[0-5]?\d)[\s\S])+|[0-5]?\d:[0-5]?\d/g);

console.log(fix1('111:222:333:444')); // ["111:222:333:444"]
console.log(fix1('1:2:3:4'));         // ["1:2:3:4"]
console.log(fix1('23:35:49'));        // ["23:35:49"]
```

Re: Kimsehwa さん

Answer

> ([0-6]?[0-9]):([0-6]?[0-9])

これは時間の表現としてはNGです
00分00秒から69分69秒までOKになっちゃいませんか？

sample
```javascript
var a=[
  "12:44 hogehogehogehoge",
  "fogefogefoge 01:30",
  "fogefoge 5:30 hogehoge",
  "test 65:30 test",
  ];
const reg = RegExp("([0-5][0-9]):([0-5][0-9])");
a.forEach(str=>{
  if(str.match(reg)){
    console.log("good:"+str);
  }else{
    console.log("bad:"+str);
  };
});
```

Answer

マッチしている箇所を置換し、消してしまえばよいです。

否定先読み

文法規則

関連した質問