Jump to main content Jump to sidebar

Forums
Wiki

Log in
Sign up

Overview
Submissions
Comments

blazejd

[D] Why do we train language models with next word prediction instead of some kind of reinforcement learning-like setup?

Submitted by blazejd t3_yzzxa2 on November 20, 2022 at 9:30 AM in MachineLearning

34 comments

18

blazejd

Registered on December 22, 2018

t2_9tvxhk0

Running Postmill