辞書のキーエラー KeyError:

Question

## やろうとしていること
・指定した辞書のキーと同じ名前のファイルが存在する
・ファイルの存在するディレクトリからファイル名を取得し、
・ファイル名と一致した辞書のキーを選択し表示する
## 例
folder
┗マイノリティーリポート
┗ヘルプ 心がつなぐストーリ
...といったフォルダが存在します

辞書
```python
dic = {'マイノリティ・リポート':1, 'ヘルプ 心がつなぐストーリー':2}
```
ここで、「ヘルプ 心がつなぐストーリー」の値を取得したい

## エラー内容
```python
#普通に直打ちすれば取得できる
print(dic["ヘルプ 心がつなぐストーリー"])
>>2
```
しかし、
```python
#以下でファイル名「ヘルプ 心がつなぐストーリー」が取得できるとします
f_name = select_file()
print(f_name)
>>ヘルプ 心がつなぐストーリー

#こいつでkeyを指定するとエラー
print(dic[f_name])
>>KeyError: 'ヘルプ 心がつなぐストーリー'
```

##困っていること
ファイル名は正しく取得できているのに、後者の場合ではなぜえらーとなるのか見当がつきません・・・。

スペースが問題ではないかとか、いろいろ試したがわからず・・・

解決策をご存知の方いらっしゃいましたら、ご教授ください。

お願いいたします。


## 追記 select_file()の中身
```python
def select_file():
    d = "folder"
    file_list = os.listdir(d)
    #フォルダのリストを表示して、入力した番号のファイル名を取得
    for i in range(len(file_list)):
        print("%s：%s" % (i,file_list[i]))
    f_name = file_list[int(input("番号を選択："))]
    return f_name
```

Accepted Answer

実行している環境はMacですか？

以下のURLにあるように、Unicodeの文字正規化には2種類あり、「正規形 C と正規形 D」といいます。
https://docs.python.jp/3/library/unicodedata.html#unicodedata.normalize

MacOSでは、正規形 Dが採用され、カタカナの濁点、半濁点が別々の文字として扱われています。
file_list[i] の文字列の長さを取得すると、濁点部分が多くカウントされると思います。
(または、 `file_list[i].encode(utf-8)` と bytes型に変換して比べるとわかりやすいかもしれません)

これらを統一化するには、2種類ある正規形のどちらかに揃える必要があります。
私は、 正規形 Cに揃えることが多いです。

Pythonには、 先に示したURLの標準ライブラリ `unicodedata` にnormalize関数で変換できます。

以下のように変換できます。

```
import unicodedata

filename = unicodedata.normalize('NFKC', file_list[0)
```

'NFKC' というformを使って、互換分解を適用してから、標準分解を適用しています。

Answer

ソース中の`print`を、以下のような`print_bytes`に置き換えて、`dic`内の`マイノリティ・リポート`と、ファイル名の`マイノリティ・リポート`が厳密に同じ文字かを確認してみてはいかがでしょうか？

```Python
# utf-8に変換した結果（バイト列）をprint
def print_bytes(s):
    print(list(s))   #  ['マ', 'イ', 'ノ', 'リ', 'テ', 'ィ', '・', 'リ', 'ホ', '゚', 'ー', 'ト']
    print(s.encode('utf-8')) # b'\xe3\x83～

# b'\xe3\x83\x9e\xe3\x82\xa4\xe3\x83\x8e\xe3\x83\xaa\xe3\x83\x86\xe3\x82\xa3\xe3\x83\xbb\xe3\x83\xaa\xe3\x83\x9d\xe3\x83\xbc\xe3\x83\x88' 
# と出力される
print_bytes("マイノリティ・リポート")
```

Answer

以下の通り試してみましたが、正常に動作しました。
一度これだけで試してみて、もしうまくいくようなら書かれてない部分に問題があるのではないかと思います。

```Python
import os

dic = {'マイノリティ・リポート':1, 'ヘルプ 心がつなぐストーリー':2}
print(dic["ヘルプ 心がつなぐストーリー"])

def select_file():
    d = "."
    file_list = os.listdir(d)
    #フォルダのリストを表示して、入力した番号のファイル名を取得
    for i in range(len(file_list)):
        print("%s：%s" % (i,file_list[i]))
    f_name = file_list[int(input("番号を選択："))]
    return f_name

f_name = select_file()
print(f_name)
print(dic[f_name])
```

やろうとしていること

例

エラー内容

追記 select_file()の中身

関連した質問