Model save

Files changed (6) hide show

adapter_config.json CHANGED Viewed

@@ -23,10 +23,10 @@
     "gate_proj",
     "q_proj",
     "o_proj",
     "v_proj",
-    "up_proj",
     "k_proj",
-    "down_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

     "gate_proj",
     "q_proj",
     "o_proj",
+    "down_proj",
     "v_proj",
     "k_proj",
+    "up_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

all_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 0.9994111874386653,
     "total_flos": 0.0,
-    "train_loss": 0.5438023588363335,
-    "train_runtime": 16632.8648,
     "train_samples": 61134,
-    "train_samples_per_second": 3.675,
-    "train_steps_per_second": 0.077
 }

 {
     "epoch": 0.9994111874386653,
     "total_flos": 0.0,
+    "train_loss": 0.0,
+    "train_runtime": 0.0132,
     "train_samples": 61134,
+    "train_samples_per_second": 4647380.664,
+    "train_steps_per_second": 96772.918
 }

runs/Nov18_14-09-30_d28f7adca72c/events.out.tfevents.1731939048.d28f7adca72c.1685093.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:7da2ba2fa6103e00ce75dcf567de6caa11d752ece668f9287e1961792b1cc515
+size 6799

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 0.9994111874386653,
     "total_flos": 0.0,
-    "train_loss": 0.5438023588363335,
-    "train_runtime": 16632.8648,
     "train_samples": 61134,
-    "train_samples_per_second": 3.675,
-    "train_steps_per_second": 0.077
 }

 {
     "epoch": 0.9994111874386653,
     "total_flos": 0.0,
+    "train_loss": 0.0,
+    "train_runtime": 0.0132,
     "train_samples": 61134,
+    "train_samples_per_second": 4647380.664,
+    "train_steps_per_second": 96772.918
 }

trainer_state.json CHANGED Viewed

@@ -2124,10 +2124,10 @@
       "epoch": 0.9994111874386653,
       "step": 1273,
       "total_flos": 0.0,
-      "train_loss": 0.5438023588363335,
-      "train_runtime": 16632.8648,
-      "train_samples_per_second": 3.675,
-      "train_steps_per_second": 0.077
     }
   ],
   "logging_steps": 10,

       "epoch": 0.9994111874386653,
       "step": 1273,
       "total_flos": 0.0,
+      "train_loss": 0.0,
+      "train_runtime": 0.0132,
+      "train_samples_per_second": 4647380.664,
+      "train_steps_per_second": 96772.918
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1e5c711814c8908294b4588d04b7f50c4175fef7498158c02d1600c8482c7a6b
 size 6136

 version https://git-lfs.github.com/spec/v1
+oid sha256:150dd618575a824787a08ba24d7b16d0ad6d5e1b42e515d39094de816bb41198
 size 6136