yueliu1999
/

GuardReasoner-3B

Text Classification

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Improve model card

#3

by nielsr HF staff - opened 3 days ago

base: refs/heads/main

←

from: refs/pr/3

Discussion Files changed

Files changed (1) hide show

README.md +3 -4

README.md CHANGED Viewed

@@ -9,13 +9,13 @@ tags:
 model-index:
 - name: GuardReasoner 3B
   results: []
-pipeline_tag: text-generation
 ---
 # GuardReasoner 3B
 This model is a fine-tuned version of [meta-llama/Llama-3.2-3B](https://huggingface.co/meta-llama/Llama-3.2-3B) via R-SFT and HS-DPO, as described in [GuardReasoner: Towards Reasoning-based LLM Safeguards](https://huggingface.co/papers/2501.18492).
 The training data of R-SFT can be found in [GuardReasonerTrain](https://huggingface.co/datasets/yueliu1999/GuardReasonerTrain).
@@ -80,5 +80,4 @@ print(output)
   journal={arXiv preprint arXiv:2501.18492},
   year={2025}
 }
-```

 model-index:
 - name: GuardReasoner 3B
   results: []
+pipeline_tag: text-classification
 ---
 # GuardReasoner 3B
 This model is a fine-tuned version of [meta-llama/Llama-3.2-3B](https://huggingface.co/meta-llama/Llama-3.2-3B) via R-SFT and HS-DPO, as described in [GuardReasoner: Towards Reasoning-based LLM Safeguards](https://huggingface.co/papers/2501.18492).
+Code: https://github.com/yueliu1999/GuardReasoner/.
 The training data of R-SFT can be found in [GuardReasonerTrain](https://huggingface.co/datasets/yueliu1999/GuardReasonerTrain).
   journal={arXiv preprint arXiv:2501.18492},
   year={2025}
 }
+```