確率的勾配降下法でパラメータを複数回更新した場合のコードについて

【前提】
初学者のものです。説明の都合上前提が長くて恐縮です。
こちらは某通信制スクール（ラビットチャレンジ）での問題になります。
※講習の設定上合格しないと回答が貰えず試行錯誤しております。
↑いい意味で鍛錬になっておりますが、テキストに載ってない部分なので赤本黒本駆使しているところです・・

0925追記：不明点を加筆

におけるコードは

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import datasets

diabetes = datasets.load_diabetes()

df = pd.DataFrame(diabetes.data, columns=diabetes.feature_names)

#説明変数
x = pd.Series(
    [-1.0,0,2.0]
)
x.head()
#目的変数
y = pd.Series(
    [0,0.5,1.5]
)
y.head()


plt.scatter(x, y)

class StochasticGradientDescent:
  def __init__(self, eta=0.1, n_iter=10, sample_rate=0.1):
    self.eta = eta
    self.n_iter = n_iter
    self.sample_rate = sample_rate
    self.grad = np.zeros((2,))
    self.loss = np.array([])

    self.v = np.zeros((2,))

  def fit(self, X, Y, w0):
    self.w = w0
    self.min_w = w0
    n_samples = int(np.ceil(len(X)*self.sample_rate))
    min_loss = 10**18

    for _ in range(self.n_iter):
      loss = 0.5 * np.sum((Y-(self.w[1]*X + self.w[0]))**2)
      if min_loss>loss:
        min_loss = loss
        self.min_w = self.w
      self.loss = np.append(self.loss, loss)
      for i in range(len(X)):
        index = i
        batch_x = X[index]
        batch_y = Y[index]
        self.grad[0] = np.sum(self.w[0]+self.w[1]*batch_x-batch_y)
        self.grad[1] = np.sum(self.w[1]*batch_x**2+self.w[0]*batch_x-batch_x*batch_y)

        self.w -= self.eta * self.grad

        print("self.w",self.w)
        print("更新量",self.eta * self.grad)

  def predict(self, x):
    return (self.w[0] + self.w[1]*x)

  @property
  def coef_(self):
    return self.min_w[1]

  @property
  def intercept_(self):
    return self.min_w[0]

  @property
  def loss_(self):
    return self.loss


w0 = np.array([0.0,1.0])


model = StochasticGradientDescent()
model.fit(x, y, w0)

print("A: ", model.coef_)
print("B: ", model.intercept_)

loss = model.loss
plt.plot(np.arange(len(loss)), np.log10(loss))

plt.show()

**という事を別のご質問枠でお教え頂きました。[https://teratail.com/questions/344874#reply-491670]

【本題】

とありますが、「σ＝0.9」「2回目の訓練サンプルをX⁼0.0」とした場合のコードを教えて頂く事は可能でしょうか？
（前提に記載しているコードのどの部分を変えればいいのか色々試したのですが選択肢に辿り着かない状態です。以下が私が試したコード）

(a, b) = (-0.1 * 0.9, 0.1 * 0.9) 　#「前回の更新量」×　「慣性項のパラメータ」※根拠は下記更新式参照
lr = 0.1    # 学習率 learning rate
(x, y) = (0.0, 0.5)

# 問題文における偏微分の定義で n = 1 とする
dL_da = lambda a, b: a * x * x + b * x - x * y
dL_db = lambda a, b: b + a * x - y

# (a, b)を1回更新する更新量を(da, db)とする
da = -lr * dL_da(a, b)
db = -lr * dL_db(a, b)

# 答えを表示
print(da, db)

#出力値
-0.0 0.041

###【参考】前回の更新量を利用して慣性項を追加する場合の更新式