ディレクトリを探索しhtmlページを見つけ、2次元配列に”ページ名”と”そのページから他のページへのリンク先”、”そのページの重要度”を記録するプログラムを作成していました。
辞書型二次元配列を作成してリンク先を出力してみようと思ったのですが、文字列が1文字ずつ改行されて出力されます。これは一体なぜなのでしょうか。何卒ご教授よろしくお願いいたします。
以下ソースコードと出力です。
import glob import re import os links = {} files = glob.glob("source*.html") for i in range(len(files)): html_file = open(files[i], "r") txt = html_file.read() links[i] = {'NAME': f'{os.path.basename(files[i])}', 'LINK': f'{re.findall("[a-zA-Z]+.html", txt)}', 'SCORE': 1.0} for page in links[2]["LINK"]: print(page) # ここで一文字ずつ出力されてしまう。
# これが出力です。 [ ' d a t a . h t m l ' , ' s e a r c h . h t m l ' ]
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。