awsuineg
/

zephyr-orpo-7b-hehe

Text Generation

Generated from Trainer

alignment-handbook

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

awsuineg commited on Nov 23, 2024

Commit

d850baf

·

verified ·

1 Parent(s): 982233d

End of training

Files changed (1) hide show

README.md +6 -3

README.md CHANGED Viewed

@@ -1,17 +1,20 @@
 ---
 base_model: mistralai/Mistral-7B-v0.1
 library_name: transformers
-model_name: zephyr-orpo-7b-hehe
 tags:
 - generated_from_trainer
 - trl
 - orpo
 licence: license
 ---
-# Model Card for zephyr-orpo-7b-hehe
-This model is a fine-tuned version of [mistralai/Mistral-7B-v0.1](https://huggingface.co/mistralai/Mistral-7B-v0.1).
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start

 ---
 base_model: mistralai/Mistral-7B-v0.1
+datasets:
+- HuggingFaceH4/ultrafeedback_binarized
 library_name: transformers
+model_name: mistralai/Mistral-7B-v0.1
 tags:
 - generated_from_trainer
+- alignment-handbook
 - trl
 - orpo
 licence: license
 ---
+# Model Card for mistralai/Mistral-7B-v0.1
+This model is a fine-tuned version of [mistralai/Mistral-7B-v0.1](https://huggingface.co/mistralai/Mistral-7B-v0.1) on the [['HuggingFaceH4/ultrafeedback_binarized']](https://huggingface.co/datasets/['HuggingFaceH4/ultrafeedback_binarized']) dataset.
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start