前提・実現したいこと
Pythhon3でテキストファイルから特定のデータを抽出してテーブルを作成したく考えております。
USPTO(米国特許庁)のHPから入手したテキストファイルは下記のような形式です。"PATN"から始まるレコードで各種情報が記載され、次の"PATN"から次のレコードが連続して出てくるタイプです。
PATN (質問者註:一つ目のレコード)
WKU RE0286710
SRC 5
APN 500649&
APT 2
PBL E
ART 315
APD 19740826
TTL Hydrophone damper assembly
ISD 19760106
NCL 18
ECL 13
EXA Basinger; Sherman D.
EXP Blix; Trygve M.
NDR 2
NFG 10
INVT
NAM Widenhofer; James W.
CTY Jackson
STA MI
ASSG
NAM Sparton Corporation
CTY Jackson
STA MI
COD 02
REIS
COD 50
APN 151269
APD 19710609
PNO 03701175
ISD 19721031
LREP
FRM Beaman & Beaman
ABST
PAL A damper for u... deployment.
BSUM
PAC
DRWD
PAC BRIEF DESCRIPTION OF THE DRAWINGS
PAR
CLMS
STM I claim:
NUM 1.
PAR 1. A .....(省略)
g water from leaving said envelope, and attachment means
associated with said envelope for attaching hydrophone structure thereto.
.Iaddend.
PATN (質問者註:ここから2つ目のレコード)
WKU RE0286729
SRC 5
APN 5475732
APT 2
PBL E
ART 353
APD 19750206
TTL Pliable tape structure
ここから必要な情報であるAPN(1レコード中に複数ある場合は、そのレコードの"PATN"に一番近いもののみを一つ)、APD(1レコード中に複数ある場合は、一番数字が小さいもののみを一つ)であり、これらの行だけを抜き出し、更に、データだけを抜き出して以下の様なテーブルを作るのが目的です。
APN APD
500649& 19710609
5475732 19750206
上記実現したいことを可能にするコードについて、何卒ご教示いただけると幸いです。