特定のテキストを抽出したい

Question

### ヘディングのテキスト### 前提・実現したいこと
huggingfaceからDLしたText Classification on GLUEというものを、UNIXのローカルターミナルで実行し、結果として表示される**eval_loss**だけを出力し、学習曲線を作成しようとしております。


### 発生している問題・エラーメッセージ

```

```

### 該当のソースコード

```Python　
import datasets
import numpy as np
import transformers
GLUE_TASKS = ["cola", "mnli", "mnli-mm", "mrpc", "qnli", "qqp", "rte", "sst2", "stsb", "wnli"]
task = "cola"
model_checkpoint = "distilbert-base-uncased"
#batch_size = 64
batch_size = 4
from datasets import load_dataset, load_metric
actual_task = "mnli" if task == "mnli-mm" else task
dataset = load_dataset("glue", actual_task)
metric = load_metric('glue', actual_task)
import datasets
import random
import pandas as pd
from IPython.display import display, HTML
def show_random_elements(dataset, num_examples=10):
    assert num_examples <= len(dataset), "Can't pick more elements than there are in the dataset."
    picks = []
    for _ in range(num_examples):
        pick = random.randint(0, len(dataset)-1)
        while pick in picks:
            pick = random.randint(0, len(dataset)-1)
        picks.append(pick)

    df = pd.DataFrame(dataset[picks])
    for column, typ in dataset.features.items():
        if isinstance(typ, datasets.ClassLabel):
            df[column] = df[column].transform(lambda i: typ.names[i])
    display(HTML(df.to_html()))
from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained(model_checkpoint, use_fast=True)
task_to_keys = {
    "cola": ("sentence", None),
    "mnli": ("premise", "hypothesis"),
    "mnli-mm": ("premise", "hypothesis"),
    "mrpc": ("sentence1", "sentence2"),
    "qnli": ("question", "sentence"),
    "qqp": ("question1", "question2"),
    "rte": ("sentence1", "sentence2"),
    "sst2": ("sentence", None),
    "stsb": ("sentence1", "sentence2"),
    "wnli": ("sentence1", "sentence2"),
}
sentence1_key, sentence2_key = task_to_keys[task]

def preprocess_function(examples):
    if sentence2_key is None:
        return tokenizer(examples[sentence1_key], truncation=True)
    return tokenizer(examples[sentence1_key], examples[sentence2_key], truncation=True)

encoded_dataset = dataset.map(preprocess_function, batched=True)

from transformers import AutoModelForSequenceClassification, TrainingArguments, Trainer

num_labels = 3 if task.startswith("mnli") else 1 if task=="stsb" else 2
model = AutoModelForSequenceClassification.from_pretrained(model_checkpoint, num_labels=num_labels)

metric_name = "pearson" if task == "stsb" else "matthews_correlation" if task == "cola" else "accuracy"
model_name = model_checkpoint.split("/")[-1]

args = TrainingArguments(
    f"{model_name}-finetuned-{task}",
    evaluation_strategy = "epoch",
    save_strategy = "epoch",
    learning_rate=2e-5,
    per_device_train_batch_size=batch_size,
    per_device_eval_batch_size=batch_size,
    num_train_epochs=2,
    weight_decay=0.01,
    load_best_model_at_end=True,
    metric_for_best_model=metric_name,
#   push_to_hub=True,
)

def compute_metrics(eval_pred):
    predictions, labels = eval_pred
    if task != "stsb":
        predictions = np.argmax(predictions, axis=1)
    else:
        predictions = predictions[:, 0]
#   print('=======================>',eval_pred)
#   print('=======================>')
    return metric.compute(predictions=predictions, references=labels)

validation_key = "validation_mismatched" if task == "mnli-mm" else "validation_matched" if task == "mnli" else "validation"
trainer = Trainer(
    model,
    args,
    train_dataset=encoded_dataset["train"].select(range(8)),
    eval_dataset=encoded_dataset[validation_key].select(range(8)),
    tokenizer=tokenizer,
    compute_metrics=compute_metrics
)

trainer.train()

     

import ast
with open ('d2.txt')as f:
     for line in f:    
        di = ast.literal-eval(line)
     print(di['eval_loss'])
     
```

### 試したこと
初歩的なことかと思われますが、何卒よろしくお願いいたします。

### 補足情報（FW/ツールのバージョンなど）
![イメージ説明](8a529f9a23605661a0ac7f02039f74ae.png)
プログラムを実行すると、上記のように表示されます。

また、sed -e '$d' d.txt > d2.txt、最後の１行を削除するプログラムを実行すると下記のようにevalが頭につくものがd2.txtにすべて抽出されます。
![イメージ説明](3150e0b99a7f22f0de6758591e609d58.png)

最後に、
import ast
with open ('d2.txt')as f:
     for line in f:    
        di = ast.literal-eval(line)
     print(di['eval_loss'])
 
をa.pyとし、実行すると２つあるeval_lossのうちの１つしか表示されず、またd2.txtにこの結果が反映されません。
![イメージ説明](bd0c42e0ac9b2f29d1841875c81a4ae8.png)
私が望む条件といたしましては、実行されたすべてのeval_lossを.txt化したく思います。

Accepted Answer

自己解決いたしました。ありがとうございました。

ヘディングのテキスト### 前提・実現したいこと

発生している問題・エラーメッセージ

該当のソースコード

試したこと

補足情報（FW/ツールのバージョンなど）

関連した質問