rl-llm-agent
/

Llama-3.2-3B-Instruct-online-dpo-alfworld-iter1

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-3.2-3B-Instruct-online-dpo-alfworld-iter1

1 contributor

History: 5 commits

sc2582's picture

upload checkpoint

6435467 verified about 2 months ago

.gitattributes

1.57 kB

Upload tokenizer about 2 months ago
README.md

5.17 kB

Upload LlamaForCausalLM about 2 months ago
config.json

950 Bytes

upload checkpoint about 2 months ago
generation_config.json

184 Bytes

Upload LlamaForCausalLM about 2 months ago
model-00001-of-00003.safetensors

5 GB
LFS

Upload LlamaForCausalLM about 2 months ago
model-00002-of-00003.safetensors

4.93 GB
LFS

Upload LlamaForCausalLM about 2 months ago
model-00003-of-00003.safetensors

2.92 GB
LFS

Upload LlamaForCausalLM about 2 months ago
model.safetensors.index.json

20.9 kB

Upload LlamaForCausalLM about 2 months ago
pytorch_model-00001-of-00002.bin
Detected Pickle imports (3)
- "torch.BFloat16Storage",
- "collections.OrderedDict",
- "torch._utils._rebuild_tensor_v2"
What is a pickle import?
4.97 GB
LFS

upload checkpoint about 2 months ago
pytorch_model-00002-of-00002.bin
Detected Pickle imports (3)
- "torch.BFloat16Storage",
- "collections.OrderedDict",
- "torch._utils._rebuild_tensor_v2"
What is a pickle import?
2.25 GB
LFS

upload checkpoint about 2 months ago
pytorch_model.bin.index.json

21 kB

upload checkpoint about 2 months ago
special_tokens_map.json

439 Bytes

Upload tokenizer about 2 months ago
tokenizer.json

17.2 MB
LFS

Upload tokenizer about 2 months ago
tokenizer_config.json

54.7 kB

Upload tokenizer about 2 months ago