pytroch_lightningでValidation sanity checkが止まってしまう

Question

### 発生している問題・エラーメッセージ
下記のURLを参考に、データセットの自作⇒pytorch_lightningによる分類 を実施しています。
エラーは出ていないのですが、最後のモデルを学習させるところでValidation sanity checkの部分が止まってしまいます。

参考URL：[https://free.kikagaku.ai/tutorial/basic_of_deep_learning/learn/pytorch_classification](https://free.kikagaku.ai/tutorial/basic_of_deep_learning/learn/pytorch_classification)



どの部分が問題で動かないのでしょうか。もし知っている方がいらっしゃればお願いします。

### 該当のソースコード

```python
import pandas as pd
import numpy
import torch
from torch import nn
from torch.nn import functional as F
from torch.utils.data import DataLoader
from torch.utils.data import random_split
from torchvision import transforms
!pip install pytorch_lightning
import pytorch_lightning as pl
from pytorch_lightning import Trainer

# colab上でデータアップロード
from google.colab import files
uploaded = files.upload()

#データ読み込み
df = pd.read_csv('/content/Dataset.csv',index_col=0) 


#データを説明変数と目的変数にわける
data = df.drop('Tag',axis=1)
target = df.iloc[:,-1]

# PyTorch で学習に使用できる形式へ変換
data = torch.tensor(data.values, dtype=torch.float32)
target = torch.tensor(target.values, dtype=torch.int64) #今回は分類なのでint64

# 目的変数と入力変数をまとめてdatasetに変換
dataset = torch.utils.data.TensorDataset(data,target)

# 各データセットのサンプル数を決定
# train : val : test = 60% : 20% : 20%
n_train = int(len(dataset) * 0.6)
n_val = int((len(dataset) - n_train) * 0.5)
n_test = len(dataset) - n_train - n_val

# データセットの分割
torch.manual_seed(0) #乱数を与えて固定
train, val, test = torch.utils.data.random_split(dataset, [n_train, n_val,n_test])


# 学習データに対する処理
class TrainNet(pl.LightningModule):

    def train_dataloader(self):
        return torch.utils.data.DataLoader(train, self.batch_size, shuffle=True, num_workers=self.num_workers)

    def training_step(self, batch, batch_nb):
        x, t = batch
        y = self.forward(x)
        loss = self.lossfun(y, t)
        results = {'loss': loss}
        return results
    
# 検証データに対する処理
class ValidationNet(pl.LightningModule):

    def val_dataloader(self):
        return torch.utils.data.DataLoader(val, self.batch_size)

    def validation_step(self, batch, batch_nb):
        x, t = batch
        y = self.forward(x)
        loss = self.lossfun(y, t)
        y_label = torch.argmax(y, dim=1)
        acc = torch.sum(t == y_label) * 1.0 / len(t)
        results = {'val_loss': loss, 'val_acc': acc}
        return results

    def validation_end(self, outputs):
        avg_loss = torch.stack([x['val_loss'] for x in outputs]).mean()
        avg_acc = torch.stack([x['val_acc'] for x in outputs]).mean()
        results = {'val_loss': avg_loss, 'val_acc': avg_acc}
        return results
    
# テストデータに対する処理
class TestNet(pl.LightningModule):

    def test_dataloader(self):
        return torch.utils.data.DataLoader(test, self.batch_size)

    def test_step(self, batch, batch_nb):
        x, t = batch
        y = self.forward(x)
        loss = self.lossfun(y, t)
        y_label = torch.argmax(y, dim=1)
        acc = torch.sum(t == y_label) * 1.0 / len(t)
        results = {'test_loss': loss, 'test_acc': acc}
        return results

    def test_end(self, outputs):
        avg_loss = torch.stack([x['test_loss'] for x in outputs]).mean()
        avg_acc = torch.stack([x['test_acc'] for x in outputs]).mean()
        results = {'test_loss': avg_loss, 'test_acc': avg_acc}
        return results

# 学習データ、検証データ、テストデータへの処理を継承したクラス
class Net(TrainNet, ValidationNet, TestNet):

    def __init__(self, batch_size=32, num_workers=0):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(77, 5)
        self.fc2 = nn.Linear(5, 2)
        self.batch_size = batch_size
        self.num_workers = num_workers

    def forward(self, x):
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        return x

    def lossfun(self, y, t):
        return F.cross_entropy(y, t)

    def configure_optimizers(self):
        return torch.optim.SGD(self.parameters(), lr=0.1)

net = Net()
trainer = Trainer(max_epochs=10)

trainer.fit(net)

```

### 最後の問題画面
Validation sanity check: 0%で止まったままになる。
![![イメージ説明](dfc5afc750e4d0e30a346362e06d134f.jpeg)](65cdb9944aef0877c81fbb940bf8329b.jpeg)

### 補足情報(バージョンなど)

colablatory下
pytorch = 1.9.0+cu102
pytorch_lightning = 1.4.0

Accepted Answer

下記によると`trainer = Trainer(num_sanity_val_steps=0)`で克服します、とありました。
[https://github.com/PyTorchLightning/pytorch-lightning/issues/2295](https://github.com/PyTorchLightning/pytorch-lightning/issues/2295)

発生している問題・エラーメッセージ

該当のソースコード

最後の問題画面

補足情報(バージョンなど)

関連した質問