回答編集履歴
1
追記
test
CHANGED
@@ -42,6 +42,10 @@
|
|
42
42
|
|
43
43
|
|
44
44
|
|
45
|
+
また、これまではあえて触れてきませんでしたが「学習どうするんだよ」という問題もあります。モデルが複雑ならそれだけ過学習したり汎化性能を得るのが難しかったりする訳です。うまく学習させられるテクニックとかモデルの構造を開発する、あるいはとにかく大量のデータを流し込んでなんとかするといったアプローチが考えられますが、前者は技術の進展が必要ですし、後者はそれこそ信じがたいほど大量データと大量の計算が必要になり、なかなかうまくは行きません。
|
46
|
+
|
47
|
+
|
48
|
+
|
45
49
|
実際は、現時点で「巨大」と言われるモデルでも10億パラメータ程度であり、これ以上のスケールのモデルを学習させるためにはモデルの構造やアルゴリズムの面での工夫が必要不可欠です。というかそれくらいが「最先端」で、その先は研究として模索されているくらいの分野になります。いずれできるようになることは期待していいのですが、現状だとそれくらいが技術的な大きさの限界と言っていいかもしれません。
|
46
50
|
|
47
51
|
|