質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

解決済

3回答

3500閲覧

PHP アクセスログの正規表現について

rera

総合スコア109

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

0クリップ

投稿2015/06/19 16:05

PHP正規表現について教えて下さい。

以下のようなアクセスログからIPアドレスだけを抜き出したいのですが
preg_replaceで第2引数を""でいい感じな正規表現はありませんでしょうか。

19 Jun 21:28:46 - 304 GET:/ ::ffff:444.333.222.111 Safari/537.36

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

ベストアンサー

うまく目的を理解していませんが、
preg_replace("/(^(\S+ ){6}| (\S)+$)/","",$line)
でいけるかもしれません。

どちらにしろカラム内に空白行が入らないのが前提条件です。

投稿2015/06/20 06:08

cocacola5959

総合スコア32

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

rera

2015/06/22 04:35

ありがとうございます! うまく抽出することが出来ました!
guest

0

アクセスログの分析は面倒ですよね。と思ったけど、おかしなフォーマットですね。
ログの形式を変更するのが正しい道だと思います。

IPv6のアドレスを正規表現で抜き出そうとすると、とんでもなく長くなるようです。
参考:IPv6アドレスをより妥当な正規表現でマッチする。 - 設計と実装の狭間で。

ログの書式が不明ですが、空白区切りの第7トークンを取り出すのであれば、正規表現で無くexplodeで分割すればいいかと思います。

追記:
ffffとコロンに目が眩んで、IPv6だとばかり思い込んでいましたが、ffffは無関係で、444.333.222.111の部分がIPv4のIPアドレスのつもりですか?

投稿2015/06/19 22:50

編集2015/06/19 23:48
otn

総合スコア84423

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

rera

2015/06/22 04:35

おっしゃるとおりでございます。 IPv4のアドレスになります。
guest

0

こんにちは。

ご質問の意図として、

  ログに出てくるIPv4アドレス部分(例では、444.333.222.111となっている部分)を
空文字列に置換して、ログから消してしまいたい。

ということなのかなと解釈しての回答になります。
(※違っていたらすみません、たぶん無意味な回答になっているので、スルーして下さい。)

オライリー「正規表現クックブック」の著者であるJan Goyvaertsさんのサイト
regular-expressions.info
にIPアドレスの正規表現が載っているので、こちらから拝借します。

http://www.regular-expressions.info/examples.html

IP Addresses

にある、一番短いもの

Similarly, you can shorten the quick regex to \b(?:\d{1,3}.){3}\d{1,3}\b

を使うとして、ご質問によれば

preg_replaceで第2引数を""で

とのことなので、以下でいかがでしょうか。

lang

1<?php 2$target = '19 Jun 21:28:46 - 304 GET:/ ::ffff:444.333.222.111 Safari/537.36'; 3$ip_addr_regex = "/\b(?:\d{1,3}\.){3}\d{1,3}\b/"; 4$replaced = preg_replace($ip_addr_regex , "", $target ); 5echo "$replaced\n";

ご参考になれば幸いです

投稿2015/06/19 22:12

編集2015/06/20 00:32
jun68ykt

総合スコア9058

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

rera

2015/06/22 04:36

丁寧にアドレスまでありがとうございます! 自分の正規表現の弱さにつくづく思い知れます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問