辞書のキーエラー KeyError:
- 評価
- クリップ 1
- VIEW 1,505
やろうとしていること
・指定した辞書のキーと同じ名前のファイルが存在する
・ファイルの存在するディレクトリからファイル名を取得し、
・ファイル名と一致した辞書のキーを選択し表示する
例
folder
┗マイノリティーリポート
┗ヘルプ 心がつなぐストーリ
...といったフォルダが存在します
辞書
dic = {'マイノリティ・リポート':1, 'ヘルプ 心がつなぐストーリー':2}
ここで、「ヘルプ 心がつなぐストーリー」の値を取得したい
エラー内容
#普通に直打ちすれば取得できる
print(dic["ヘルプ 心がつなぐストーリー"])
>>2
しかし、
#以下でファイル名「ヘルプ 心がつなぐストーリー」が取得できるとします
f_name = select_file()
print(f_name)
>>ヘルプ 心がつなぐストーリー
#こいつでkeyを指定するとエラー
print(dic[f_name])
>>KeyError: 'ヘルプ 心がつなぐストーリー'
困っていること
ファイル名は正しく取得できているのに、後者の場合ではなぜえらーとなるのか見当がつきません・・・。
スペースが問題ではないかとか、いろいろ試したがわからず・・・
解決策をご存知の方いらっしゃいましたら、ご教授ください。
お願いいたします。
追記 select_file()の中身
def select_file():
d = "folder"
file_list = os.listdir(d)
#フォルダのリストを表示して、入力した番号のファイル名を取得
for i in range(len(file_list)):
print("%s:%s" % (i,file_list[i]))
f_name = file_list[int(input("番号を選択:"))]
return f_name
-
気になる質問をクリップする
クリップした質問は、後からいつでもマイページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
クリップを取り消します
-
良い質問の評価を上げる
以下のような質問は評価を上げましょう
- 質問内容が明確
- 自分も答えを知りたい
- 質問者以外のユーザにも役立つ
評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。
質問の評価を上げたことを取り消します
-
評価を下げられる数の上限に達しました
評価を下げることができません
- 1日5回まで評価を下げられます
- 1日に1ユーザに対して2回まで評価を下げられます
質問の評価を下げる
teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。
- プログラミングに関係のない質問
- やってほしいことだけを記載した丸投げの質問
- 問題・課題が含まれていない質問
- 意図的に内容が抹消された質問
- 広告と受け取られるような投稿
評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。
質問の評価を下げたことを取り消します
この機能は開放されていません
評価を下げる条件を満たしてません
質問の評価を下げる機能の利用条件
この機能を利用するためには、以下の事項を行う必要があります。
- 質問回答など一定の行動
-
メールアドレスの認証
メールアドレスの認証
-
質問評価に関するヘルプページの閲覧
質問評価に関するヘルプページの閲覧
checkベストアンサー
+5
実行している環境はMacですか?
以下のURLにあるように、Unicodeの文字正規化には2種類あり、「正規形 C と正規形 D」といいます。
https://docs.python.jp/3/library/unicodedata.html#unicodedata.normalize
MacOSでは、正規形 Dが採用され、カタカナの濁点、半濁点が別々の文字として扱われています。
file_list[i] の文字列の長さを取得すると、濁点部分が多くカウントされると思います。
(または、 file_list[i].encode(utf-8)
と bytes型に変換して比べるとわかりやすいかもしれません)
これらを統一化するには、2種類ある正規形のどちらかに揃える必要があります。
私は、 正規形 Cに揃えることが多いです。
Pythonには、 先に示したURLの標準ライブラリ unicodedata
にnormalize関数で変換できます。
以下のように変換できます。
import unicodedata
filename = unicodedata.normalize('NFKC', file_list[0)
'NFKC' という正を使って、互換分解を適用してから、標準分解を適用
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
+1
以下の通り試してみましたが、正常に動作しました。
一度これだけで試してみて、もしうまくいくようなら書かれてない部分に問題があるのではないかと思います。
import os
dic = {'マイノリティ・リポート':1, 'ヘルプ 心がつなぐストーリー':2}
print(dic["ヘルプ 心がつなぐストーリー"])
def select_file():
d = "."
file_list = os.listdir(d)
#フォルダのリストを表示して、入力した番号のファイル名を取得
for i in range(len(file_list)):
print("%s:%s" % (i,file_list[i]))
f_name = file_list[int(input("番号を選択:"))]
return f_name
f_name = select_file()
print(f_name)
print(dic[f_name])
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
+1
ソース中のprint
を、以下のようなprint_bytes
に置き換えて、dic
内のマイノリティ・リポート
と、ファイル名のマイノリティ・リポート
が厳密に同じ文字かを確認してみてはいかがでしょうか?
# utf-8に変換した結果(バイト列)をprint
def print_bytes(s):
print(list(s)) # ['マ', 'イ', 'ノ', 'リ', 'テ', 'ィ', '・', 'リ', 'ホ', '゚', 'ー', 'ト']
print(s.encode('utf-8')) # b'\xe3\x83~
# b'\xe3\x83\x9e\xe3\x82\xa4\xe3\x83\x8e\xe3\x83\xaa\xe3\x83\x86\xe3\x82\xa3\xe3\x83\xbb\xe3\x83\xaa\xe3\x83\x9d\xe3\x83\xbc\xe3\x83\x88'
# と出力される
print_bytes("マイノリティ・リポート")
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
15分調べてもわからないことは、teratailで質問しよう!
- ただいまの回答率 90.37%
- 質問をまとめることで、思考を整理して素早く解決
- テンプレート機能で、簡単に質問をまとめられる
質問への追記・修正、ベストアンサー選択の依頼
Zuishin
2017/03/20 17:01
select_file() の中身を書いてください。
starrow1103
2017/03/20 17:06
追記しました!