Python3 英単語採点　ループ処理　lambda式

Question

目標) 
英単語採点アプリをつくりたい

採点方法

・正しい単語と完全一致→ 　2 点
・正しい単語と長さ(文字数)が異なる→ × 0 点
・正しい単語と長さは同じだが 1 文字だけ異なる→ △ 1 点
・正しい単語と長さは同じだが 2 文字以上異なる→ × 0 点

例)
正解: desk, 解答: desc → 1 点 (長さは同じだが 1 文字だけ異なる)
正解: phone, 解答: pheen → 0 点 (長さは同じだが 2 文字異なる)
正解: cute, 解答: cute → 2 点 (完全一致)

合計得点 → 3 点

なお、N回分英単語が入力される
正解の英単語と生徒の回答が半角スペースで与えられる


入力例1

2
desk deee
cute cuta

出力例1
1


入力例2
4
pen pen
note nota
head hhhh
arm aaa

出力例2
3


質問)

以下のループ処理のコードをlmabda式に書きなおしたいが、細かい条件分岐を一文とまとめられない。

お力添えお願い致します。

また、このような処理を関数やクラス等を利用してよりスマートなコードがございましたら、教えて頂きたいです。





```ここに言語を入力
コード

N = int(input())

data = list(input().split() for i in range(N))
print(*data)

score = 0


for x in data:
    if x[0] == x[-1]:
        score += 2
    elif (len(x[0]) == len(x[-1])):
#一文字以上異なる場合を処理、　しかし文字の位置が考慮されていないから不十分
        match = [i for i in set(x[0]) if i in x[-1]]
        if len(match) == len(x[0])-1:
            score += 1
        else:
            pass
    else:
        pass
print(score)



```



  

```ここに言語を入力
コード

N = int(input())

data = list(input().split() for i in range(N))

#完全一致
data_perfect = list(map(lambda x: x[0] == x[-1],data))

#長さのみ同じのリスト作成
data_same_length = list(map(lambda x: len(x[0]) == len(x[-1]),data))


#長さのみ同じリスト　から　一文字のみ違うリストをつくりたい
#この処理が上手く機能しない
data_nearly = list(map(lambda x: for i in set(x[0]) if i in x[-1],data_same_length))

result = sum(map(int, [x and y for x,y in zip(data_perfect, data_nearly)]))
print(result)



```




※追記質問

一文字だけ異なる場合のときに、私のループ処理では文字の位置が考慮されていない。

match = [i for i in set(x[0]) if i in x[-1]]

集合の値のみを見ているため、文字の位置が関係していない。


記入例)

note one!  

この場合だと、ルール上は　文字の位置まで考慮するため、文字の長さが同じだが、スペルミスが２つ以上のため　０点

しかし、私のコードだと、文字の位置を考慮していないため、文字の長さが同じ、かつスペルミスが１つのため、１点

コメント頂いた方のコードを参照すると以下のようになる。



```ここに言語を入力
コード

def mark(right_answer, answer):
    if len(right_answer) != len(answer):
        return 0

#文字の位置を考慮しがら、スペルミスを処理

    diff = sum(
        1 for ra, a in zip(right_answer, answer) if ra != a
    )
    if diff == 0:
        return 2
    if diff == 1:
        return 1

    return 0


n = int(input())
total_score = sum(
    mark(*input().split()) for _ in range(n)
)

print(total_score)

```

なぜ以下のコードが文字の位置を考慮しがら、スペルミスを処理できる理由が分かるようでわかりません。

先頭から文字の一致を確認し、スペルミスがあればその数を合計する処理でしょうか？



```ここに言語を入力
コード

#文字の位置を考慮しがら、スペルミスを処理

    diff = sum(
        1 for ra, a in zip(right_answer, answer) if ra != a
    )
    if diff == 0:
        return 2
    if diff == 1:
        return 1

    return 0

```

Accepted Answer

lambda式は複雑な処理にはあまり適しませんから、この場合は普通の関数で書いた方が良いでしょう。

まずは愚直に書いてみるのも一つの手です。

```python
def main():
    n = int(input())

    lst = []
    for i in range(n):
        lst.append(input().split())

    score = 0
    for true_ans, exam_ans in lst:
        if len(true_ans) != len(exam_ans):
            score += 0
        else:
            diff_count = 0
            for c1, c2 in zip(true_ans, exam_ans):
                if c1 != c2:
                    diff_count += 1
            if 0 == diff_count:
                score += 2
            elif 1 == diff_count:
                score +=  1
            else:
                score +=  0
    
    print(score)

if __name__ == "__main__":
    main()
```

上を踏まえた上で、採点処理は関数化して切り出してみます。

```python
def count_diff(true_ans, exam_ans):
    diff_count = 0
    for c1, c2 in zip(true_ans, exam_ans):
        if c1 != c2:
            diff_count += 1
    return diff_count

def saiten(true_ans, exam_ans):
    if len(true_ans) != len(exam_ans):
        return 0
    else:
        n = count_diff(true_ans, exam_ans)
        if 0 == n:
            return 2
        elif 1 >= n:
            return 1
        else:
            return 0
            
def main():
    n = int(input())

    lst = []
    for i in range(n):
        lst.append(input().split())

    score = 0
    for true_ans, exam_ans in lst:
        score += saiten(true_ans, exam_ans)
    
    print(score)

if __name__ == "__main__":
    main()
```

すっきりしたといえばすっきりしましたが、コード行数は大して減ってはいないという見方もできるでしょう。だけれど、これ以上複雑なことをやるとかえって見通しが悪くなるので、これくらいで良いのです。

余談ですが、本当は私が先に思いついたのは下の例の方です。「まずは1問だけ採点する関数を作ろう。そうすれば、あとはできたも同然だ。そのために、まずは異なり文字数を数える関数を作るか」というような発想で書きました。参考にしてください。

### 追記
「lambda式は複雑な処理にはあまり適しません」と書いてしまいましたが、あえてlambdaバージョンのsaitenを作ってみた例。
```python
saiten = lambda true_ans, exam_ans:(
    0 
    if len(true_ans) != len(exam_ans) else
    (lambda count_diff:( 
        [2, 1][count_diff] if count_diff <= 1 else 0))(
            sum([1 for c1, c2 in zip(true_ans, exam_ans) if c1 != c2])))
```
ご覧の通り可読性は悪いのですが、できなくはありません。

### 質問の追記に関して
恐らくzipや内包表記が入り乱れているのでわかりづらいのだと思います。
ナイーブに書くとこうなります。

```python
def count_diff(true_ans, exam_ans):
    """同じ文字列長を仮定
    """
    diff_count = 0
    for i in range(len(true_ans)):
        if true_ans[i] != exam_ans[i]:
            diff_count += 1
    return diff_count
```

これはたぶん追っていけばわかるはずです。
ついでにzipの出力も確認しておくことにしましょう。


```python
>>> list(zip("head", "hhhh"))
[('h', 'h'), ('e', 'h'), ('a', 'h'), ('d', 'h')]
```

あとはリスト内包表記にするだけで、これは簡単です。
```python
sum([1 for c1, c2 in zip(right_answer, answer) if c1 != c2])
```

ただしLouiS0616さんのこのコードは、

```python
diff = sum(
        1 for ra, a in zip(right_answer, answer) if ra != a
    )
```

0. リスト内包表記ではなくジェネレータ式を使っている
1. ジェネレータ式を関数の引数として書く場合、かっこを省略できるという糖衣構文を使っている

ので一見すると理解しがたいものに見えます。

1については、ジェネレータ式はジェネレータを作るものです。ジェネレータとはなにかというと、だいたい次のようなポジションだと思ってください。

- イテレータ：forで繰り返し処理できるもの。文字列、リスト、タプル、"ジェネレータ"など
- ジェネレータ：動的に要素が生成されるイテレータ

2については、本来ジェネレータ式は()で囲うことで作ることができるのですが、関数の唯一の引数として渡された場合はこの()を省略できるというルールがあります。それを使われています。

参考：
[ジェネレータ式の文法について調べてみた ](http://www.rhoboro.com/2017/07/08/python-generator-grammer.html)

Answer

他の回答者様とロジックは同様です。

```Python 
INT_MAX = __import__('sys').maxsize


def mark(ans_pair):
    '''
    ・正しい単語と文字数が異なる 0点

    ・正しい単語と文字数は同じだが2文字以上異なる 0点
    ・正しい単語と文字数は同じだが1文字だけ異なる 1点
    ・正しい単語と文字数は同じだが0文字だけ異なる 2点
    '''
    ans_r, ans_t = ans_pair
    wrong_count = (
        INT_MAX if len(ans_r) != len(ans_t)
        else sum(r != t for r, t in zip(ans_r, ans_t))
    )
    return 0 if 2 <= wrong_count else [2, 1][wrong_count]


test_paper = [
    input().split()
    for _ in range(int(input()))
]
total = sum(map(mark, test_paper))
```

Answer

とりあえず殴り書き。

```python
score = sum([max(0, 2 - len(x[0]) + len(list(filter(lambda c: c[0] == c[1], zip(x[0], x[1]))))) for x in filter(lambda word: len(word[0]) == len(word[1]), data)])
```

ここからが本番ｗ

Answer

ラムダ式ではないですけど、部分的に関数にするという発想は良いと思います。
```Python
def mark(right_answer, answer):
    if len(right_answer) != len(answer):
        return 0
    
    diff = sum(
        1 for ra, a in zip(right_answer, answer) if ra != a
    )
    if diff == 0:
        return 2
    if diff == 1:
        return 1
    
    return 0


n = int(input())
total_score = sum(
    mark(*input().split()) for _ in range(n)
)

print(total_score)
```

[Wandbox](https://wandbox.org/permlink/BjUJHZLCBCJ43zjW)

---
> 以下のループ処理のコードをlmabda式に書きなおしたいが、細かい条件分岐を一文とまとめられない。

条件式を使えば分岐も可能ですが、かなり読みづらくなります。
ラムダ式で書きづらいときは通常の関数を定義した方が良いです。

> この処理が上手く機能しない
data_nearly = list(map(lambda x: for i in set(x[0]) if i in x[-1],data_same_length))

ラムダ式内でfor文は使えないです。
ループ処理を書くためには、内包表記を使うか、再帰を使った黒テクニックが必要です。

追記を受けて
---
> なぜ以下のコードが文字の位置を考慮しがら、スペルミスを処理できる理由が分かるようでわかりません。

次のように書いているのと似ています。並行して一文字ずつ取り出し、比較しているのです。
```Python
diff = 0
for ra, a in zip(right_answer, answer):
    if ra != a:
        diff += 1
```

---
**似ている**という表現を使ったのは、内包表記ありきのテクニックを使っているからです。
次の処理を追ってみます。
```Python
>>> [(ra, a) for ra, a in zip('hoge', 'huge') if ra != a]
[('o', 'u')]
```

`if ra != a`を満たすときだけ、リストに要素が追加されることがわかります。

また、`sum(1... )`という記法は、**シーケンス長を算出するとき**にしばしば使います。
```Python
>>> sum(1 for _ in range(3))
3
>>> sum(1 for _ in range(1, 4))
3
>>> sum(1 for _ in 'hoge')
4
```

毎周『1』を生成して、それを累計しているわけです。

---
上記二つのテクニックを組み合わせると、先の処理は次のように説明できます。
```Python
diff = sum(
    1 for ra, a in zip(right_answer, answer) if ra != a
)
```

0. 二つの文字列を並列に比較する。
・もし文字が同じでないときは、リストに1を追加する。
・そうでないときは、リストに何も追加しない。
0. リストの合計を算出する。この場合要素が全部1なので、リスト長を求めているのと同じ。

実際にはジェネレータを利用しているのでもう少し効率的ですが、まだ気にしなくて良いでしょう。

おまけ
---
ゲームの特性によっては、クロージャを使うと便利です。
```Python
def make_mark(right_answer):
    right_len = len(right_answer)
    
    def mark(answer):
        if len(answer) != right_len:
            return 0
        
        diff = sum(
            1 for ra, a in zip(right_answer, answer) if ra != a
        )
        if diff == 0:
            return 2
        if diff == 1:
            return 1
        
        return 0
    
    return mark


n = int(input())
mark = make_mark(input())

for _ in range(n):
    answer = input()
    print(mark(answer))
```

[Wandbox](https://wandbox.org/permlink/vRuZDNI3QVXBidO7)

追記

質問の追記に関して

追記を受けて

おまけ

関連した質問