Language modeling question. Lesson 4

aloksaan · September 8, 2018, 2:13pm

Few question on language modeling from lesson 4.

1.While testing a trained language model, why do we need to reset the hidden states? What exactly the reseting is doing here?

Reset hidden state

m.reset()

Get predictions from model

res,*_ = m(t)
When i look at the shape of res it says
torch.Size([21, 37392])
What is 21 here?

Thanks for your help

yang-zhang · December 14, 2018, 9:44pm

I also have trouble finding what reset does on the forum. Hope someone can point us to some references.