Pythonのリスト処理について
解決済
回答 3
投稿
- 評価
- クリップ 0
- VIEW 565
Pythonのリストについて質問です。
重複した数字、文字列を含むリストから順序を変えずに重複している文字列だけを削除する方法が分かりません。
ご教授よろしくお願いいたします。
やりたいこと
処理前 list = [1, 6, 1, 10, "apple", "orange", "apple", "grape"]
↓重複文字列を除去
処理後 list = [1, 6, 1, 10, "apple", "orange", "grape"]
list = [1, 6, 1, 10, "apple", "orange", "apple", "grape"]
list_pro = []
for i in list:
if i not in list_pro:
list_pro.append(i)
-
気になる質問をクリップする
クリップした質問は、後からいつでもマイページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
クリップを取り消します
-
良い質問の評価を上げる
以下のような質問は評価を上げましょう
- 質問内容が明確
- 自分も答えを知りたい
- 質問者以外のユーザにも役立つ
評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。
質問の評価を上げたことを取り消します
-
評価を下げられる数の上限に達しました
評価を下げることができません
- 1日5回まで評価を下げられます
- 1日に1ユーザに対して2回まで評価を下げられます
質問の評価を下げる
teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。
- プログラミングに関係のない質問
- やってほしいことだけを記載した丸投げの質問
- 問題・課題が含まれていない質問
- 意図的に内容が抹消された質問
- 過去に投稿した質問と同じ内容の質問
- 広告と受け取られるような投稿
評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。
質問の評価を下げたことを取り消します
この機能は開放されていません
評価を下げる条件を満たしてません
質問の評価を下げる機能の利用条件
この機能を利用するためには、以下の事項を行う必要があります。
- 質問回答など一定の行動
-
メールアドレスの認証
メールアドレスの認証
-
質問評価に関するヘルプページの閲覧
質問評価に関するヘルプページの閲覧
checkベストアンサー
+3
記憶用の集合を用意するのが簡単です。
src = [1, 6, 1, 10, "apple", "orange", "apple", "grape"]
_work_set = set()
dst = []
for e in src:
if not isinstance(e, str):
dst.append(e)
continue
if e in _work_set:
continue
_work_set.add(e)
dst.append(e)
print(dst)
実行結果 Wandbox
[1, 6, 1, 10, 'apple', 'orange', 'grape']
また、そもそも数値と文字列を同じリストに入れているのが間違いだとも思います。
後々の処理が簡潔になるように、同じ型の要素のみで構成した方が良いです。
その他、気になること
変数名として list
を用いることは厳に避けて下さい。
解消しづらいエラーを引き起こします。
>>> list('spam')
['s', 'p', 'a', 'm']
>>>
>>> list = [1, 2, 3]
>>>
>>> list('spam')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'list' object is not callable
シャドウイングと呼ばれるトラブルです。
他にも付けてしまいがちな名前として、str
id
len
int
input
dict
などがあります。
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
+2
集合を使わなくてもリストだけで出来ますね。
a = [1, 6, 1, 10, "apple", "orange", "apple", "grape"]
b = []
t = []
for e in a:
if type(e) != str:
b.append(e)
elif not e in t:
t.append(e)
b.append(e)
print(b)
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
+1
x.py
def is_first(data, idx):
if type(data[idx]) != str:
return True
return data.index(data[idx]) == idx
data = [1, 6, 1, 10, "apple", "orange", "apple", "grape"]
data2 = [data[i] for i in range(len(data)) if is_first(data, i)]
print(data2)
is_first() の定義を調整することで、他の条件で要素の順番を保って取り出すことができます。
追記:
計算量はへっていないかもしれませんが、行数をさらに少なくしてみました。
y.py
data = [1, 6, 1, 10, "apple", "orange", "apple", "grape"]
z = {e: idx for idx, e in reversed(list(enumerate(data))) if type(e) == str}
data2 = [e for idx, e in enumerate(data) if z.get(e) == None or z.get(e) == idx]
print(data2)
data を後ろかスキャンしながら 要素 -> 出現位置 のハッシュをつくっていっています。
(値は、最初にその要素が出現した位置になります)
こうして作ったハッシュをつかって data から重複値を取り除いていきます。
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
15分調べてもわからないことは、teratailで質問しよう!
- ただいまの回答率 88.10%
- 質問をまとめることで、思考を整理して素早く解決
- テンプレート機能で、簡単に質問をまとめられる
2019/06/20 17:00
記憶用の集合、簡単に書けて便利ですね!
無事に解決できました。
リストの構成や変数名のつけ方など、とても勉強になりました。
ありがとうございました。