ファイル内要素の比較，抽出

Question

#python3.4
#Windows

A,B二つのファイルが以下のような形で存在します．

A
```
0000_0000
0000_0001
0000_0005
・
・
・
```
B
```
0000_0000	0002_0004
0000_0001	0005_0012
0000_0001	0092_0001
0000_0002	0000_0001
・
・
・
```
ともにidの羅列です．Aは1列，Bはタブ区切りで2列存在します．

行いたい処理としては，AのidとBの1列目のidを比較し，
BにおけるAのidと一致するものを抽出するというものです．
例のファイルですと，結果として
```
0000_0000	0002_0004
0000_0001	0005_0012
0000_0001	0092_0001
```
の3列が抽出できれば理想的です．
(Aにidの重複はありませんが，Bの1列目には重複があります)

どのような命令を作成すればよいでしょうか．

Answer

B のデータをメモリー中の全部読み込んでよいなら、次のようにすることで抽出できます。
data1.txt, data2.txt. 1.py を次のように準備します。

data1.csv
```
0000_0000
0000_0001
0000_0005
```
data2.csv
```
0000_0000	0002_0004
0000_0001	0005_0012
0000_0001	0092_0001
0000_0002	0000_0001
```
1.py
```python
import csv;

data = {}
for row2 in csv.reader(open('data2.csv', 'r'), delimiter = '	'):
    id = row2[0]
    if not id in data:
        data[id] = []
    data[id] += [row2[1]]

for row1 in csv.reader(open('data1.csv', 'r')):
    id = row1[0]
    if id in data:
        for d in data[id]:
            print(id + '	' + d)
```
実行結果：
```
$ python3 1.py
0000_0000	0002_0004
0000_0001	0005_0012
0000_0001	0092_0001
```

Answer

単純にちょろっと流す程度であれば下記など...

```Python
#coding: utf-8

import csv;

for row in csv.reader(open('data1.txt', 'r')):
    for row2 in csv.reader(open('data2.txt', 'r'), delimiter = '	'):
        if ( row[0] == row2[0] ):
            print row2[0] + "	" + row2[1];
```

関連した質問