nvidia
/

Llama3-70B-SteerLM-RM

Model card Files Files and versions Community

zhilinw commited on Jun 9

Commit

e9440c9

•

1 Parent(s): b86ede9

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -48,8 +48,8 @@ Llama3-70B-SteerLM-RM is trained with NVIDIA [NeMo-Aligner](https://github.com/N
  | Model  | Type of Model|  Overall | Chat | Chat-Hard | Safety | Reasoning |
 |:-----------------------------|:----------------|:-----|:----------|:-------|:----------|:-----------------------|
   | ArmoRM-Llama3-8B-v0.1 | Trained with GPT4 Generated Data|  90.8 | 96.9     | 76.8  | 92.2 | 97.3  |
-  | Cohere May 2024   | Proprietary LLM |   89.5  | 96.4     | 71.3      | **92.7** | 97.7  |
-  | _**Llama3-70B-SteerLM-RM**_  | Trained with Permissive Licensed Data | 88.8  | 91.3 |   80.3 | 92.8  | 90.7 |
   | Google Gemini Pro 1.5 | Proprietary LLM |  88.1 | 92.3  | 80.6 | 87.5  | 92.0  |
   | RLHFlow-Llama3-8B | Trained with GPT4 Generated Data |   87.1   |  **98.3**  |  65.8   |    89.7     |   94.7 |
   | Cohere March 2024 | Proprietary LLM | 87.1|  94.7 | 65.1 | 90.3 | **98.7** |

  | Model  | Type of Model|  Overall | Chat | Chat-Hard | Safety | Reasoning |
 |:-----------------------------|:----------------|:-----|:----------|:-------|:----------|:-----------------------|
   | ArmoRM-Llama3-8B-v0.1 | Trained with GPT4 Generated Data|  90.8 | 96.9     | 76.8  | 92.2 | 97.3  |
+  | Cohere May 2024   | Proprietary LLM |   89.5  | 96.4     | 71.3      | 92.7 | 97.7  |
+  | _**Llama3-70B-SteerLM-RM**_  | Trained with Permissive Licensed Data | 88.8  | 91.3 |   80.3 | **92.8**  | 90.7 |
   | Google Gemini Pro 1.5 | Proprietary LLM |  88.1 | 92.3  | 80.6 | 87.5  | 92.0  |
   | RLHFlow-Llama3-8B | Trained with GPT4 Generated Data |   87.1   |  **98.3**  |  65.8   |    89.7     |   94.7 |
   | Cohere March 2024 | Proprietary LLM | 87.1|  94.7 | 65.1 | 90.3 | **98.7** |