やりたいこと:txtファイルからアクセスログを読み込み、'time','request','status','bytes'のカラムにてデータフレーム化
不明点:
⓵エラー:Shape of passed values is (1, 2), indices imply (4, 2)
⓶ここでのyeildの意味。(検索してもイマイチ理解ができませんでした。)
現状:
access_log.txt
127.0.0.1 - - [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326
127.0.0.1 - - [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326
別ディレクトリ
import re
import pandas as pd
pattern = re.compile('^\S+ \S+ \S+ [(.)] "(.)" (\S+) (\S+)$')
def parse_access_log(path):
for line in open(path):
for m in pattern.finditer(line):
yeild m.group()
columns = ['time','request','status','bytes']
pd.DataFrame(parse_access_log('access_log.txt'),columns=columns)
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/11/23 06:42