連続する行を削除したい

file1
1AAA
2BBB
3CCC
4DDD
5DDD
6DDD
7EEE
8FFF

このようなファイルがある時、DDDが連続しているので、2つ目と3つめのDDDを削除したいです。
連続する行に書かれている文字列はわかっています。

AAA
BBB
CCC
DDD
EEE
FFF

python
1path = file1
2f = open(path)
3line = f.readlines()
4f.close()
5
6for list in line:
7    with open(path) as f:
8         next(f)
9         for line2 in f
10             if line2 == list:

このように、同じファイルの1行目とn+1行目を順に比較していこうとしました。
しかし、この方法だと、同じ行が2回以上連続している場合に対処できないことに気づき、行き詰まっています。

うまいやり方をご教示ください。
よろしくお願いします。

行動規範の内容に同意します

回答4件

Python
1from __future__ import print_function
2import sys
3
4if sys.version_info.major == 2:
5    from itertools import izip_longest as zip_longest
6else:
7    from itertools import zip_longest
8
9    
10with open('file.txt') as fin:
11    src = fin.read().splitlines()
12    
13dst = [
14    l1 for l1, l2 in zip_longest(src, src[1:])
15    if l1 != l2
16]
17print(*dst, sep='\n')

3.xでも2.7でも動作します。

評価を受けて

@低評価を付けた方
改めて回答を見直しましたが、低評価の理由に思い当たりませんでした。
改善する余地があるのであれば対応しますので、問題点をコメント頂けますか。

投稿2019/11/27 23:06

編集2019/11/28 11:22

LouiS0616

総合スコア35668

ベストアンサー

意味不明なコードですね。

lineにファイル全部を読み込み済みなので、for list in line:で、1行ずつ見ていきます。
で、前の行と同じだったら、出力をしない。
比較する対象である前の行は、前回のループで別の変数に覚えておく必要があります。

投稿2019/11/27 10:00

otn

総合スコア85886

退会済みユーザー

2019/11/27 10:07

＞比較する対象である前の行は、前回のループで別の変数に覚えておく必要があります。この部分がどうすればいいのかわからないので、コードを示していただけないでしょうか？

otn

2019/11/27 10:10

old = list

退会済みユーザー

2019/11/27 10:35

質問で書いたコードと教えていただいた考え方を元にできました。少し考えればわかることでした。ありがとうございます。

otn

2019/11/27 11:05 編集

old = None for list in line: →if list!= old: →→print(list) →old = list ですかね。list と line の名前が直感と逆な気がします。

行動規範の内容に同意します

二番目の結果が求めているものでしょうか？

d.py

python3
1in_file = "data0.txt"
2out_file_1 ="data1.txt"
3out_file_2 ="data2.txt"
4
5with open(in_file, 'r') as f:
6    lines = f.readlines()
7
8lines_1 = sorted(list(set(lines)),key=lines.index)
9
10with open(out_file_1, 'w') as f:
11    for line in lines_1:
12        f.write(line)
13
14lines_2 = []
15for line in lines:
16    if lines_2 == [] or lines_2[-1] != line:
17        lines_2.append(line)
18
19with open(out_file_2, 'w') as f:
20    for line in lines_2:
21        f.write(line)