python /で囲まれた文字列抽出

前提・実現したいこと

プログラム初心者です。早速ですが、質問内容は
.txtの/で囲まれた文字列に該当する.labの数値を取り出したいです。

例えば、
txtファイルの/ko:/はlabファイルの１～2行目の0.0425000と0.1225000という数値を抽出したいです。

txtファイルでは/ko:/ /ko:/ですので、結果として欲しいファイルは、

0.0425000 0.0725000 k
0.0725000 0.1225000 o:
0.9725000 1.0525000 k
1.0525000 1.2025000 o:

<file.txt>

/ko:/ireruho:janakute/ko:/dasuho:

<file.lab>

0.0425000 0.0725000 k
0.0725000 0.1225000 o:
0.1225000 0.2725000 i
0.2725000 0.3025000 r
0.3025000 0.3725000 e
0.3725000 0.4225000 r
0.4225000 0.4625000 u
0.4625000 0.5025000 h
0.5025000 0.6125000 o:
0.6125000 0.6525000 j
0.6525000 0.7025000 a
0.7025000 0.7425000 n
0.7425000 0.8025000 a
0.8025000 0.8525000 k
0.8525000 0.8925000 u
0.8925000 0.9325000 t
0.9325000 0.9725000 e
0.9725000 1.0525000 k
1.0525000 1.2025000 o:
1.2025000 1.3925000 d
1.3925000 1.4625000 a
1.4625000 1.5225000 s
1.5225000 1.5525000 u
1.5525000 1.6325000 h
1.6325000 1.7425000 o:

発生している問題・エラーメッセージ

エラーメッセージ

コード

# -*- coding: utf-8 -*-
import re

count = 0
array = []
f1 = open("file.txt").read()
f2 = open("file.lab", 'r')

indexes = [i for i, x in enumerate(f1) if x == '/']
start = f1[indexes[0] + 1]
end =  f1[indexes[1] - 1]
if end == ':':
    end = f1[indexes[1] - 2]

for s in open("file.lab"):
    itemList = s.split()
    if start in itemList:
        print itemList
    if itemList.count(end):
        print itemList

./python string.py
['0.0425000', '0.0725000', 'k']
['0.8025000', '0.8525000', 'k']
['0.9725000', '1.0525000', 'k']

試したこと

両方のファイルをリスト化した後、1回目の"/"が来ると1つ後の要素を取り出し、2回目の"/"が来ると1つ前の要素を取り出してlabファイルと比較しようとしましたが、途中の"/"がない場合の要素を取り出してしまったり、3,4回目の"/"が来ると1回目と同じ要素を抽出してしまったりしました．．．

申し訳ありませんが、ご教授お願い致します．．．

補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。

can110

2018/12/29 08:12

インデントがなくなっているのでソースコードはコードブロック```で囲んでください。

usu

2018/12/29 08:39

ご指摘ありがとうございました。早急に修整致します。

can110

2018/12/29 09:00 編集

修正ありがとうございます。ちょっと抽出ルールが理解できませんので提示例の場合の理想の結果を追記いただくと回答得られやすくなると思います。

usu

2018/12/29 09:06

ありがとうございます。早速ですが、修整させていただきました。他にも修整箇所があればお願いいたします。

can110

2018/12/29 09:17

「/ireruho:janakute/」部分も「/」で囲まれていますが、抽出されない理由がよく分かりません。「/」で始まり「:/」で終わる範囲のみ抽出という感じでしょうか？

usu

2018/12/29 09:26

：は調音符で文字扱いなので、他の文字と同じように扱いたいです。「/」のみ記号扱いで、1回目の「/」から2回目の「/」までの文字を抽出し、3回目の「/」から4回目の「/」までの文字を抽出したいと考えています。

can110

2018/12/29 10:17

.labのファイルは言語処理に関するものでしょうかつまり先頭から奇数個目（１，３，５～）を先頭とし偶数個目（２、４，６～）を末尾とする範囲のみを抽出する感じですかね。

usu

2018/12/29 10:25

はい、音素に時刻ラベルをつけたファイルです。そうです！考えてみたのですが、配列の長さも異なるのでちんぷんかんぷんでした．．．

行動規範の内容に同意します

回答1件

ベストアンサー

/の出現につき、先頭から奇数個目（１，３，５～）を先頭とし偶数個目（２、４，６～）を末尾とする範囲のみを抽出すればよいかと思います。
なお、:はそれに前する文字と合わせて１文字と勘定してよいので、抽出処理の最初に消しています。

Python
1f1 = '/ko:/ireruho:janakute/ko:/dasuho:' # = open("file.txt").read()
2f1 = f1.replace(':','') # ':'は抽出には邪魔なので最初に消す
3
4slash_cnt = 0 # '/'の出現回数
5range_st = -1 # 抽出開始位置
6pos = 0       # .labファイル上での行位置
7ranges = []
8for c in f1:
9    if c == '/':
10        if slash_cnt % 2 == 0:  # 開始
11            range_st = pos
12        else:                   # 終了
13            ranges.append((range_st,pos))
14        slash_cnt += 1
15    else:
16        pos += 1 # .lab上には'/'は存在しないので。
17
18print(ranges) # [(0, 2), (17, 19)]
19
20with open('file.lab') as f:
21    lines = f.readlines()
22    lines = [l.rstrip() for l in lines]
23
24for r in ranges:
25    print('-----')
26    for pos in range(r[0],r[1]):
27        print(lines[pos])
28"""
29-----
300.0425000 0.0725000 k
310.0725000 0.1225000 o:
32-----
330.9725000 1.0525000 k
341.0525000 1.2025000 o:
35"""