Кажется, вы что то напутали в конфиге. Из за этого кстати судя по всему можно получить OOM в google colab, если использовать AutoModelForCausalLM, а не MistralForCausalLM
COOM (Cuda Out Of Memory) AutoModelForCausalLM на kaggle тоже вызывает.
с AutoModel:
с Mistral:
it has been fixed in this PR
· Sign up or log in to comment