質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.21%

SVGファイルの不要データを除去したいのですが…

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 562

okabe-yuya

score 8

 実現したいこと、全体フロー

プログラミングを初めて2週間ほどの初心者です。
自分なりにコードを書いてみましたが、上手くいきません。
内容は「SVGデータを読み込み、不要な開始タグとタグ内部の文字列、終了タグを除去」するというものです。

全体的なフローとしては

  1. ファイルを選択して、ファイル名を取得する(def main():)
  2. リストに記述されたタグ名で、取得ファイルから不要データを除去していく(def change():)
  3. リスト内に既出でないタグがあれば処理を続行(データを除去)し、該当しない場合は新規ファイル名で保存

といった具合に動作すればと、思っております。

 発生している問題・エラーメッセージ

File "svg_changer.py", line 18
with open(new_name, "a")
^
SyntaxError: invalid syntax

構文エラー??
flake8 py__でチェックしましたが、該当する点はありませんでした。

 該当のソースコード

#coding utf-8

import re, os
import tkinter.filedialog as tkfd

#不要なタグ名をリストに格納
unnecessary_tags = ["title"]

#引数にファイル名、不要なタグと中身を空白に変更し保存
def change(image):
    with open(image. "r", encoding="utf-8") as f:
        for row in f:
            for tag in unnecessary_tags:
                if tag in unnecessary_tags:
                    delete_tag = re.sub(r"<{}>.*</{}>".format(tag), "", row)
                else:
                    new_file_name = "new_" + image
                    with open(new_file_name, "a")
                    break

#ファイルを選択し、ファイル名を取得する
def main():
    target_file = tkfd.askopenfilename()
    filename = os.path.dirname(target_file)
    change(filename)

if __name__="__main__":
    main()

 疑問点

現時点で、3点ほど疑問があります。

  • ファイルをtkfd.askopenfile()で開いた後に、with open()で再度開くのは正しいのか
  •  タグ内の要素が既出かどうかを判定するif文は正しいのか
  • 正規表現に.format()を用いて変数を当てることができるのか

自身で、多くの文献を調べましたが、納得いく答えを見るけることができませんでした。
知識不足がお恥ずかしいですが、改善のヒントを教えていただきたいです。
また、不明な点、必要な追記情報などありましたら、お申し付けください。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

+1

シンタックスエラーについて、18行目の最後にコロンを追加、19行目のbreakにインデントを追加する必要があります。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/02/17 17:01

    Traceback (most recent call last):
    File "svg_changer.py", line 29, in <module>
    main()
    File "svg_changer.py", line 26, in main
    change(filename)
    File "svg_changer.py", line 15, in change
    delete_tag = re.sub(r"<{}>.*</{}>".format(tag), "", row)
    IndexError: tuple index out of range

    本当に何度も申し訳ないのですが、タプルインデックスというエラーが発生するようになってしまいました。

    キャンセル

  • 2018/02/17 17:14

    formatの使い方がちょっと間違っています。delete_tag = re.sub(r"<{tag}>.*</{tag}>".format(tag=tag), "", row)

    キャンセル

  • 2018/02/18 21:32

    返信が遅くなりまして、申し訳ありません。
    .format()をご指摘のように改善した所、エラーが発生しなくなりました。
    if文の分岐、自分の思った通りに機能していないようなので、一度、じっくり見直して見ようと思います。
    ただ、、課題点であった
    ・基本的なファイルを読み込み
    ・正規表現部分

    に関しては、きちんと機能するようになりました。
    何度も、親切にアドバイスを頂きまして、有難うございました。
    また、何かあれば知恵をお貸し頂きたいです。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.21%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる