{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 2.999774113395076,
  "eval_steps": 1000,
  "global_step": 33201,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.00903546419697312,
      "grad_norm": 7.14754056930542,
      "learning_rate": 6.8599999999999995e-06,
      "loss": 1.8388,
      "step": 100
    },
    {
      "epoch": 0.01807092839394624,
      "grad_norm": 6.974137783050537,
      "learning_rate": 1.386e-05,
      "loss": 1.2229,
      "step": 200
    },
    {
      "epoch": 0.02710639259091936,
      "grad_norm": 6.240023612976074,
      "learning_rate": 2.0859999999999997e-05,
      "loss": 0.9997,
      "step": 300
    },
    {
      "epoch": 0.03614185678789248,
      "grad_norm": 5.526381492614746,
      "learning_rate": 2.7859999999999998e-05,
      "loss": 0.8603,
      "step": 400
    },
    {
      "epoch": 0.0451773209848656,
      "grad_norm": 6.0143938064575195,
      "learning_rate": 3.4859999999999995e-05,
      "loss": 0.7584,
      "step": 500
    },
    {
      "epoch": 0.05421278518183872,
      "grad_norm": 5.181371212005615,
      "learning_rate": 4.1859999999999996e-05,
      "loss": 0.6841,
      "step": 600
    },
    {
      "epoch": 0.06324824937881184,
      "grad_norm": 4.984240531921387,
      "learning_rate": 4.885999999999999e-05,
      "loss": 0.644,
      "step": 700
    },
    {
      "epoch": 0.07228371357578496,
      "grad_norm": 5.0428266525268555,
      "learning_rate": 5.586e-05,
      "loss": 0.6025,
      "step": 800
    },
    {
      "epoch": 0.08131917777275807,
      "grad_norm": 4.736971378326416,
      "learning_rate": 6.285999999999999e-05,
      "loss": 0.5776,
      "step": 900
    },
    {
      "epoch": 0.0903546419697312,
      "grad_norm": 4.559544086456299,
      "learning_rate": 6.986e-05,
      "loss": 0.551,
      "step": 1000
    },
    {
      "epoch": 0.0903546419697312,
      "eval_loss": 0.2710006833076477,
      "eval_runtime": 89.4841,
      "eval_samples_per_second": 47.64,
      "eval_steps_per_second": 0.749,
      "eval_wer": 0.26942939113802994,
      "step": 1000
    },
    {
      "epoch": 0.09939010616670431,
      "grad_norm": 4.705749988555908,
      "learning_rate": 6.978696313779074e-05,
      "loss": 0.5356,
      "step": 1100
    },
    {
      "epoch": 0.10842557036367743,
      "grad_norm": 4.287839412689209,
      "learning_rate": 6.9569578584516e-05,
      "loss": 0.5058,
      "step": 1200
    },
    {
      "epoch": 0.11746103456065056,
      "grad_norm": 3.9484827518463135,
      "learning_rate": 6.935219403124125e-05,
      "loss": 0.4863,
      "step": 1300
    },
    {
      "epoch": 0.12649649875762367,
      "grad_norm": 4.207424640655518,
      "learning_rate": 6.913480947796651e-05,
      "loss": 0.468,
      "step": 1400
    },
    {
      "epoch": 0.1355319629545968,
      "grad_norm": 4.078378200531006,
      "learning_rate": 6.891742492469178e-05,
      "loss": 0.4522,
      "step": 1500
    },
    {
      "epoch": 0.14456742715156992,
      "grad_norm": 3.6946797370910645,
      "learning_rate": 6.870004037141703e-05,
      "loss": 0.4396,
      "step": 1600
    },
    {
      "epoch": 0.15360289134854302,
      "grad_norm": 3.742530345916748,
      "learning_rate": 6.848265581814229e-05,
      "loss": 0.4338,
      "step": 1700
    },
    {
      "epoch": 0.16263835554551614,
      "grad_norm": 4.0423078536987305,
      "learning_rate": 6.826527126486755e-05,
      "loss": 0.4232,
      "step": 1800
    },
    {
      "epoch": 0.17167381974248927,
      "grad_norm": 3.7348833084106445,
      "learning_rate": 6.80478867115928e-05,
      "loss": 0.4144,
      "step": 1900
    },
    {
      "epoch": 0.1807092839394624,
      "grad_norm": 3.4496703147888184,
      "learning_rate": 6.783050215831805e-05,
      "loss": 0.4016,
      "step": 2000
    },
    {
      "epoch": 0.1807092839394624,
      "eval_loss": 0.20093074440956116,
      "eval_runtime": 89.3016,
      "eval_samples_per_second": 47.737,
      "eval_steps_per_second": 0.75,
      "eval_wer": 0.20614174901710763,
      "step": 2000
    },
    {
      "epoch": 0.18974474813643552,
      "grad_norm": 3.3866732120513916,
      "learning_rate": 6.761311760504332e-05,
      "loss": 0.3858,
      "step": 2100
    },
    {
      "epoch": 0.19878021233340862,
      "grad_norm": 4.071012496948242,
      "learning_rate": 6.739573305176857e-05,
      "loss": 0.3875,
      "step": 2200
    },
    {
      "epoch": 0.20781567653038174,
      "grad_norm": 3.373796224594116,
      "learning_rate": 6.717834849849383e-05,
      "loss": 0.3795,
      "step": 2300
    },
    {
      "epoch": 0.21685114072735487,
      "grad_norm": 3.105025291442871,
      "learning_rate": 6.696096394521908e-05,
      "loss": 0.3787,
      "step": 2400
    },
    {
      "epoch": 0.225886604924328,
      "grad_norm": 3.8723206520080566,
      "learning_rate": 6.674357939194434e-05,
      "loss": 0.3716,
      "step": 2500
    },
    {
      "epoch": 0.23492206912130112,
      "grad_norm": 3.2043449878692627,
      "learning_rate": 6.65261948386696e-05,
      "loss": 0.3662,
      "step": 2600
    },
    {
      "epoch": 0.24395753331827422,
      "grad_norm": 3.2647688388824463,
      "learning_rate": 6.631098413092761e-05,
      "loss": 0.3567,
      "step": 2700
    },
    {
      "epoch": 0.25299299751524734,
      "grad_norm": 3.255851984024048,
      "learning_rate": 6.609359957765287e-05,
      "loss": 0.3541,
      "step": 2800
    },
    {
      "epoch": 0.26202846171222044,
      "grad_norm": 3.103607177734375,
      "learning_rate": 6.587621502437812e-05,
      "loss": 0.3551,
      "step": 2900
    },
    {
      "epoch": 0.2710639259091936,
      "grad_norm": 3.7592177391052246,
      "learning_rate": 6.565883047110337e-05,
      "loss": 0.3449,
      "step": 3000
    },
    {
      "epoch": 0.2710639259091936,
      "eval_loss": 0.17070473730564117,
      "eval_runtime": 88.3474,
      "eval_samples_per_second": 48.253,
      "eval_steps_per_second": 0.758,
      "eval_wer": 0.17702688343427903,
      "step": 3000
    },
    {
      "epoch": 0.2800993901061667,
      "grad_norm": 2.7764692306518555,
      "learning_rate": 6.544144591782863e-05,
      "loss": 0.3477,
      "step": 3100
    },
    {
      "epoch": 0.28913485430313984,
      "grad_norm": 2.980421543121338,
      "learning_rate": 6.522406136455388e-05,
      "loss": 0.3367,
      "step": 3200
    },
    {
      "epoch": 0.29817031850011294,
      "grad_norm": 3.0955636501312256,
      "learning_rate": 6.500667681127915e-05,
      "loss": 0.3347,
      "step": 3300
    },
    {
      "epoch": 0.30720578269708604,
      "grad_norm": 2.942781925201416,
      "learning_rate": 6.47892922580044e-05,
      "loss": 0.3363,
      "step": 3400
    },
    {
      "epoch": 0.3162412468940592,
      "grad_norm": 2.7990803718566895,
      "learning_rate": 6.457190770472966e-05,
      "loss": 0.3324,
      "step": 3500
    },
    {
      "epoch": 0.3252767110910323,
      "grad_norm": 3.0384480953216553,
      "learning_rate": 6.435452315145492e-05,
      "loss": 0.3273,
      "step": 3600
    },
    {
      "epoch": 0.33431217528800544,
      "grad_norm": 2.8415443897247314,
      "learning_rate": 6.413713859818017e-05,
      "loss": 0.3231,
      "step": 3700
    },
    {
      "epoch": 0.34334763948497854,
      "grad_norm": 2.706265687942505,
      "learning_rate": 6.391975404490544e-05,
      "loss": 0.3224,
      "step": 3800
    },
    {
      "epoch": 0.35238310368195164,
      "grad_norm": 2.77278995513916,
      "learning_rate": 6.370236949163069e-05,
      "loss": 0.32,
      "step": 3900
    },
    {
      "epoch": 0.3614185678789248,
      "grad_norm": 2.9242990016937256,
      "learning_rate": 6.348498493835595e-05,
      "loss": 0.3147,
      "step": 4000
    },
    {
      "epoch": 0.3614185678789248,
      "eval_loss": 0.1588164120912552,
      "eval_runtime": 89.3911,
      "eval_samples_per_second": 47.689,
      "eval_steps_per_second": 0.75,
      "eval_wer": 0.1649984061204973,
      "step": 4000
    },
    {
      "epoch": 0.3704540320758979,
      "grad_norm": 3.196282148361206,
      "learning_rate": 6.32676003850812e-05,
      "loss": 0.3112,
      "step": 4100
    },
    {
      "epoch": 0.37948949627287104,
      "grad_norm": 3.880776882171631,
      "learning_rate": 6.305021583180646e-05,
      "loss": 0.3154,
      "step": 4200
    },
    {
      "epoch": 0.38852496046984414,
      "grad_norm": 2.7569668292999268,
      "learning_rate": 6.283283127853171e-05,
      "loss": 0.3108,
      "step": 4300
    },
    {
      "epoch": 0.39756042466681724,
      "grad_norm": 2.951040267944336,
      "learning_rate": 6.261544672525697e-05,
      "loss": 0.3093,
      "step": 4400
    },
    {
      "epoch": 0.4065958888637904,
      "grad_norm": 2.667750358581543,
      "learning_rate": 6.239806217198222e-05,
      "loss": 0.3082,
      "step": 4500
    },
    {
      "epoch": 0.4156313530607635,
      "grad_norm": 2.872540235519409,
      "learning_rate": 6.218067761870749e-05,
      "loss": 0.3005,
      "step": 4600
    },
    {
      "epoch": 0.42466681725773664,
      "grad_norm": 3.15378999710083,
      "learning_rate": 6.196329306543275e-05,
      "loss": 0.2994,
      "step": 4700
    },
    {
      "epoch": 0.43370228145470974,
      "grad_norm": 2.879260301589966,
      "learning_rate": 6.1745908512158e-05,
      "loss": 0.2959,
      "step": 4800
    },
    {
      "epoch": 0.44273774565168283,
      "grad_norm": 2.811612367630005,
      "learning_rate": 6.152852395888326e-05,
      "loss": 0.2974,
      "step": 4900
    },
    {
      "epoch": 0.451773209848656,
      "grad_norm": 2.7307889461517334,
      "learning_rate": 6.131113940560851e-05,
      "loss": 0.2936,
      "step": 5000
    },
    {
      "epoch": 0.451773209848656,
      "eval_loss": 0.1471971571445465,
      "eval_runtime": 88.7501,
      "eval_samples_per_second": 48.034,
      "eval_steps_per_second": 0.755,
      "eval_wer": 0.1551376049304006,
      "step": 5000
    },
    {
      "epoch": 0.4608086740456291,
      "grad_norm": 2.734050750732422,
      "learning_rate": 6.109375485233378e-05,
      "loss": 0.2917,
      "step": 5100
    },
    {
      "epoch": 0.46984413824260224,
      "grad_norm": 2.650491952896118,
      "learning_rate": 6.0876370299059026e-05,
      "loss": 0.2929,
      "step": 5200
    },
    {
      "epoch": 0.47887960243957534,
      "grad_norm": 2.519413709640503,
      "learning_rate": 6.065898574578429e-05,
      "loss": 0.2919,
      "step": 5300
    },
    {
      "epoch": 0.48791506663654843,
      "grad_norm": 2.6014676094055176,
      "learning_rate": 6.0441601192509545e-05,
      "loss": 0.2811,
      "step": 5400
    },
    {
      "epoch": 0.4969505308335216,
      "grad_norm": 2.7325778007507324,
      "learning_rate": 6.02242166392348e-05,
      "loss": 0.2878,
      "step": 5500
    },
    {
      "epoch": 0.5059859950304947,
      "grad_norm": 2.636491298675537,
      "learning_rate": 6.000683208596006e-05,
      "loss": 0.2821,
      "step": 5600
    },
    {
      "epoch": 0.5150214592274678,
      "grad_norm": 2.6922860145568848,
      "learning_rate": 5.9789447532685315e-05,
      "loss": 0.2828,
      "step": 5700
    },
    {
      "epoch": 0.5240569234244409,
      "grad_norm": 2.4657480716705322,
      "learning_rate": 5.957206297941057e-05,
      "loss": 0.2845,
      "step": 5800
    },
    {
      "epoch": 0.5330923876214141,
      "grad_norm": 2.6574530601501465,
      "learning_rate": 5.935467842613583e-05,
      "loss": 0.28,
      "step": 5900
    },
    {
      "epoch": 0.5421278518183872,
      "grad_norm": 2.769786834716797,
      "learning_rate": 5.913729387286109e-05,
      "loss": 0.2758,
      "step": 6000
    },
    {
      "epoch": 0.5421278518183872,
      "eval_loss": 0.1405603438615799,
      "eval_runtime": 90.2531,
      "eval_samples_per_second": 47.234,
      "eval_steps_per_second": 0.742,
      "eval_wer": 0.14793326957815323,
      "step": 6000
    },
    {
      "epoch": 0.5511633160153603,
      "grad_norm": 2.6292548179626465,
      "learning_rate": 5.891990931958634e-05,
      "loss": 0.2744,
      "step": 6100
    },
    {
      "epoch": 0.5601987802123334,
      "grad_norm": 2.536770820617676,
      "learning_rate": 5.87025247663116e-05,
      "loss": 0.2735,
      "step": 6200
    },
    {
      "epoch": 0.5692342444093065,
      "grad_norm": 2.3336434364318848,
      "learning_rate": 5.848514021303685e-05,
      "loss": 0.2764,
      "step": 6300
    },
    {
      "epoch": 0.5782697086062797,
      "grad_norm": 2.677401542663574,
      "learning_rate": 5.8267755659762116e-05,
      "loss": 0.2761,
      "step": 6400
    },
    {
      "epoch": 0.5873051728032528,
      "grad_norm": 2.634038209915161,
      "learning_rate": 5.805037110648737e-05,
      "loss": 0.2694,
      "step": 6500
    },
    {
      "epoch": 0.5963406370002259,
      "grad_norm": 2.643404245376587,
      "learning_rate": 5.783298655321262e-05,
      "loss": 0.263,
      "step": 6600
    },
    {
      "epoch": 0.605376101197199,
      "grad_norm": 2.2921056747436523,
      "learning_rate": 5.7615601999937885e-05,
      "loss": 0.2738,
      "step": 6700
    },
    {
      "epoch": 0.6144115653941721,
      "grad_norm": 2.398670196533203,
      "learning_rate": 5.739821744666314e-05,
      "loss": 0.2682,
      "step": 6800
    },
    {
      "epoch": 0.6234470295911453,
      "grad_norm": 2.447571277618408,
      "learning_rate": 5.71808328933884e-05,
      "loss": 0.2653,
      "step": 6900
    },
    {
      "epoch": 0.6324824937881184,
      "grad_norm": 2.270413637161255,
      "learning_rate": 5.6963448340113654e-05,
      "loss": 0.2663,
      "step": 7000
    },
    {
      "epoch": 0.6324824937881184,
      "eval_loss": 0.13218513131141663,
      "eval_runtime": 89.0739,
      "eval_samples_per_second": 47.859,
      "eval_steps_per_second": 0.752,
      "eval_wer": 0.13926256508341303,
      "step": 7000
    },
    {
      "epoch": 0.6415179579850915,
      "grad_norm": 2.406534433364868,
      "learning_rate": 5.674606378683892e-05,
      "loss": 0.2701,
      "step": 7100
    },
    {
      "epoch": 0.6505534221820646,
      "grad_norm": 2.3954741954803467,
      "learning_rate": 5.652867923356417e-05,
      "loss": 0.2661,
      "step": 7200
    },
    {
      "epoch": 0.6595888863790377,
      "grad_norm": 2.3920400142669678,
      "learning_rate": 5.631129468028943e-05,
      "loss": 0.2662,
      "step": 7300
    },
    {
      "epoch": 0.6686243505760109,
      "grad_norm": 2.6168298721313477,
      "learning_rate": 5.6096083972547435e-05,
      "loss": 0.259,
      "step": 7400
    },
    {
      "epoch": 0.677659814772984,
      "grad_norm": 2.351517915725708,
      "learning_rate": 5.587869941927269e-05,
      "loss": 0.2531,
      "step": 7500
    },
    {
      "epoch": 0.6866952789699571,
      "grad_norm": 2.4925589561462402,
      "learning_rate": 5.566131486599794e-05,
      "loss": 0.2584,
      "step": 7600
    },
    {
      "epoch": 0.6957307431669302,
      "grad_norm": 2.465437650680542,
      "learning_rate": 5.5443930312723204e-05,
      "loss": 0.2572,
      "step": 7700
    },
    {
      "epoch": 0.7047662073639033,
      "grad_norm": 2.383103370666504,
      "learning_rate": 5.522654575944846e-05,
      "loss": 0.2541,
      "step": 7800
    },
    {
      "epoch": 0.7138016715608765,
      "grad_norm": 2.254746675491333,
      "learning_rate": 5.5009161206173716e-05,
      "loss": 0.2551,
      "step": 7900
    },
    {
      "epoch": 0.7228371357578496,
      "grad_norm": 2.601073980331421,
      "learning_rate": 5.479177665289897e-05,
      "loss": 0.2613,
      "step": 8000
    },
    {
      "epoch": 0.7228371357578496,
      "eval_loss": 0.1282639354467392,
      "eval_runtime": 89.4564,
      "eval_samples_per_second": 47.654,
      "eval_steps_per_second": 0.749,
      "eval_wer": 0.1401763893316332,
      "step": 8000
    },
    {
      "epoch": 0.7318725999548227,
      "grad_norm": 2.6043508052825928,
      "learning_rate": 5.4574392099624236e-05,
      "loss": 0.2527,
      "step": 8100
    },
    {
      "epoch": 0.7409080641517958,
      "grad_norm": 2.4817826747894287,
      "learning_rate": 5.4357007546349486e-05,
      "loss": 0.2531,
      "step": 8200
    },
    {
      "epoch": 0.7499435283487689,
      "grad_norm": 2.2043120861053467,
      "learning_rate": 5.413962299307475e-05,
      "loss": 0.2508,
      "step": 8300
    },
    {
      "epoch": 0.7589789925457421,
      "grad_norm": 2.436621904373169,
      "learning_rate": 5.39222384398e-05,
      "loss": 0.2524,
      "step": 8400
    },
    {
      "epoch": 0.7680144567427152,
      "grad_norm": 2.2948272228240967,
      "learning_rate": 5.3704853886525255e-05,
      "loss": 0.2511,
      "step": 8500
    },
    {
      "epoch": 0.7770499209396883,
      "grad_norm": 2.516068935394287,
      "learning_rate": 5.348746933325052e-05,
      "loss": 0.2503,
      "step": 8600
    },
    {
      "epoch": 0.7860853851366614,
      "grad_norm": 2.286062002182007,
      "learning_rate": 5.327008477997577e-05,
      "loss": 0.249,
      "step": 8700
    },
    {
      "epoch": 0.7951208493336345,
      "grad_norm": 2.2099480628967285,
      "learning_rate": 5.305270022670103e-05,
      "loss": 0.2476,
      "step": 8800
    },
    {
      "epoch": 0.8041563135306077,
      "grad_norm": 2.279094934463501,
      "learning_rate": 5.283531567342629e-05,
      "loss": 0.2477,
      "step": 8900
    },
    {
      "epoch": 0.8131917777275808,
      "grad_norm": 2.5608932971954346,
      "learning_rate": 5.2617931120151544e-05,
      "loss": 0.2491,
      "step": 9000
    },
    {
      "epoch": 0.8131917777275808,
      "eval_loss": 0.12159302085638046,
      "eval_runtime": 88.1859,
      "eval_samples_per_second": 48.341,
      "eval_steps_per_second": 0.76,
      "eval_wer": 0.1319094676442461,
      "step": 9000
    },
    {
      "epoch": 0.8222272419245539,
      "grad_norm": 2.8134467601776123,
      "learning_rate": 5.24005465668768e-05,
      "loss": 0.2393,
      "step": 9100
    },
    {
      "epoch": 0.831262706121527,
      "grad_norm": 2.109177589416504,
      "learning_rate": 5.218316201360206e-05,
      "loss": 0.247,
      "step": 9200
    },
    {
      "epoch": 0.8402981703185001,
      "grad_norm": 2.333599090576172,
      "learning_rate": 5.196577746032731e-05,
      "loss": 0.2396,
      "step": 9300
    },
    {
      "epoch": 0.8493336345154733,
      "grad_norm": 2.263291120529175,
      "learning_rate": 5.174839290705257e-05,
      "loss": 0.2454,
      "step": 9400
    },
    {
      "epoch": 0.8583690987124464,
      "grad_norm": 2.1932239532470703,
      "learning_rate": 5.153100835377783e-05,
      "loss": 0.2441,
      "step": 9500
    },
    {
      "epoch": 0.8674045629094195,
      "grad_norm": 2.3545312881469727,
      "learning_rate": 5.131362380050308e-05,
      "loss": 0.2388,
      "step": 9600
    },
    {
      "epoch": 0.8764400271063926,
      "grad_norm": 1.9302074909210205,
      "learning_rate": 5.1096239247228345e-05,
      "loss": 0.2386,
      "step": 9700
    },
    {
      "epoch": 0.8854754913033657,
      "grad_norm": 2.2227907180786133,
      "learning_rate": 5.0878854693953595e-05,
      "loss": 0.245,
      "step": 9800
    },
    {
      "epoch": 0.8945109555003389,
      "grad_norm": 2.0656354427337646,
      "learning_rate": 5.066147014067886e-05,
      "loss": 0.2341,
      "step": 9900
    },
    {
      "epoch": 0.903546419697312,
      "grad_norm": 2.062394142150879,
      "learning_rate": 5.0444085587404114e-05,
      "loss": 0.238,
      "step": 10000
    },
    {
      "epoch": 0.903546419697312,
      "eval_loss": 0.11923061311244965,
      "eval_runtime": 88.4115,
      "eval_samples_per_second": 48.218,
      "eval_steps_per_second": 0.758,
      "eval_wer": 0.1290829879927744,
      "step": 10000
    },
    {
      "epoch": 0.9125818838942851,
      "grad_norm": 2.264702081680298,
      "learning_rate": 5.022670103412938e-05,
      "loss": 0.2386,
      "step": 10100
    },
    {
      "epoch": 0.9216173480912582,
      "grad_norm": 2.0281338691711426,
      "learning_rate": 5.000931648085463e-05,
      "loss": 0.2374,
      "step": 10200
    },
    {
      "epoch": 0.9306528122882313,
      "grad_norm": 2.0940310955047607,
      "learning_rate": 4.9791931927579883e-05,
      "loss": 0.2349,
      "step": 10300
    },
    {
      "epoch": 0.9396882764852045,
      "grad_norm": 2.1335864067077637,
      "learning_rate": 4.957454737430514e-05,
      "loss": 0.2326,
      "step": 10400
    },
    {
      "epoch": 0.9487237406821776,
      "grad_norm": 2.3644163608551025,
      "learning_rate": 4.9357162821030396e-05,
      "loss": 0.2314,
      "step": 10500
    },
    {
      "epoch": 0.9577592048791507,
      "grad_norm": 2.029175043106079,
      "learning_rate": 4.91419521132884e-05,
      "loss": 0.2363,
      "step": 10600
    },
    {
      "epoch": 0.9667946690761238,
      "grad_norm": 2.630101203918457,
      "learning_rate": 4.8924567560013664e-05,
      "loss": 0.2298,
      "step": 10700
    },
    {
      "epoch": 0.9758301332730969,
      "grad_norm": 2.356724500656128,
      "learning_rate": 4.870718300673891e-05,
      "loss": 0.2269,
      "step": 10800
    },
    {
      "epoch": 0.9848655974700701,
      "grad_norm": 2.1543145179748535,
      "learning_rate": 4.8489798453464176e-05,
      "loss": 0.2377,
      "step": 10900
    },
    {
      "epoch": 0.9939010616670432,
      "grad_norm": 2.399824857711792,
      "learning_rate": 4.827241390018943e-05,
      "loss": 0.2287,
      "step": 11000
    },
    {
      "epoch": 0.9939010616670432,
      "eval_loss": 0.11506820470094681,
      "eval_runtime": 89.5431,
      "eval_samples_per_second": 47.608,
      "eval_steps_per_second": 0.748,
      "eval_wer": 0.1275528636701732,
      "step": 11000
    },
    {
      "epoch": 1.0028913485430313,
      "grad_norm": 2.18354868888855,
      "learning_rate": 4.805502934691468e-05,
      "loss": 0.2129,
      "step": 11100
    },
    {
      "epoch": 1.0119268127400045,
      "grad_norm": 2.018084764480591,
      "learning_rate": 4.7837644793639945e-05,
      "loss": 0.1792,
      "step": 11200
    },
    {
      "epoch": 1.0209622769369777,
      "grad_norm": 2.1397042274475098,
      "learning_rate": 4.76202602403652e-05,
      "loss": 0.1794,
      "step": 11300
    },
    {
      "epoch": 1.0299977411339507,
      "grad_norm": 1.925986886024475,
      "learning_rate": 4.740287568709046e-05,
      "loss": 0.1816,
      "step": 11400
    },
    {
      "epoch": 1.039033205330924,
      "grad_norm": 2.0704362392425537,
      "learning_rate": 4.7185491133815715e-05,
      "loss": 0.1767,
      "step": 11500
    },
    {
      "epoch": 1.048068669527897,
      "grad_norm": 1.8338583707809448,
      "learning_rate": 4.696810658054098e-05,
      "loss": 0.1767,
      "step": 11600
    },
    {
      "epoch": 1.05710413372487,
      "grad_norm": 1.9655053615570068,
      "learning_rate": 4.675072202726623e-05,
      "loss": 0.1814,
      "step": 11700
    },
    {
      "epoch": 1.0661395979218433,
      "grad_norm": 1.880100965499878,
      "learning_rate": 4.653333747399149e-05,
      "loss": 0.1786,
      "step": 11800
    },
    {
      "epoch": 1.0751750621188163,
      "grad_norm": 2.52089524269104,
      "learning_rate": 4.631595292071674e-05,
      "loss": 0.1796,
      "step": 11900
    },
    {
      "epoch": 1.0842105263157895,
      "grad_norm": 2.179574728012085,
      "learning_rate": 4.6098568367441997e-05,
      "loss": 0.1798,
      "step": 12000
    },
    {
      "epoch": 1.0842105263157895,
      "eval_loss": 0.11312589794397354,
      "eval_runtime": 89.9356,
      "eval_samples_per_second": 47.401,
      "eval_steps_per_second": 0.745,
      "eval_wer": 0.12343002868983105,
      "step": 12000
    },
    {
      "epoch": 1.0932459905127625,
      "grad_norm": 2.3577959537506104,
      "learning_rate": 4.588118381416726e-05,
      "loss": 0.1834,
      "step": 12100
    },
    {
      "epoch": 1.1022814547097357,
      "grad_norm": 2.2626988887786865,
      "learning_rate": 4.566379926089251e-05,
      "loss": 0.1792,
      "step": 12200
    },
    {
      "epoch": 1.111316918906709,
      "grad_norm": 2.0373926162719727,
      "learning_rate": 4.544641470761777e-05,
      "loss": 0.1773,
      "step": 12300
    },
    {
      "epoch": 1.120352383103682,
      "grad_norm": 1.8774733543395996,
      "learning_rate": 4.522903015434303e-05,
      "loss": 0.1763,
      "step": 12400
    },
    {
      "epoch": 1.1293878473006551,
      "grad_norm": 2.0867061614990234,
      "learning_rate": 4.5011645601068285e-05,
      "loss": 0.1775,
      "step": 12500
    },
    {
      "epoch": 1.138423311497628,
      "grad_norm": 1.822313904762268,
      "learning_rate": 4.479426104779354e-05,
      "loss": 0.182,
      "step": 12600
    },
    {
      "epoch": 1.1474587756946013,
      "grad_norm": 1.9483801126480103,
      "learning_rate": 4.4579050340051546e-05,
      "loss": 0.1801,
      "step": 12700
    },
    {
      "epoch": 1.1564942398915745,
      "grad_norm": 1.7819561958312988,
      "learning_rate": 4.436166578677681e-05,
      "loss": 0.175,
      "step": 12800
    },
    {
      "epoch": 1.1655297040885475,
      "grad_norm": 2.2512149810791016,
      "learning_rate": 4.414428123350206e-05,
      "loss": 0.1771,
      "step": 12900
    },
    {
      "epoch": 1.1745651682855207,
      "grad_norm": 2.0755016803741455,
      "learning_rate": 4.3926896680227315e-05,
      "loss": 0.1791,
      "step": 13000
    },
    {
      "epoch": 1.1745651682855207,
      "eval_loss": 0.1113397553563118,
      "eval_runtime": 89.8896,
      "eval_samples_per_second": 47.425,
      "eval_steps_per_second": 0.745,
      "eval_wer": 0.11858463500159389,
      "step": 13000
    },
    {
      "epoch": 1.1836006324824937,
      "grad_norm": 1.8246344327926636,
      "learning_rate": 4.370951212695258e-05,
      "loss": 0.1826,
      "step": 13100
    },
    {
      "epoch": 1.192636096679467,
      "grad_norm": 2.0341689586639404,
      "learning_rate": 4.349212757367783e-05,
      "loss": 0.1795,
      "step": 13200
    },
    {
      "epoch": 1.2016715608764401,
      "grad_norm": 1.8964906930923462,
      "learning_rate": 4.327474302040309e-05,
      "loss": 0.1777,
      "step": 13300
    },
    {
      "epoch": 1.210707025073413,
      "grad_norm": 1.9983662366867065,
      "learning_rate": 4.305735846712835e-05,
      "loss": 0.1777,
      "step": 13400
    },
    {
      "epoch": 1.2197424892703863,
      "grad_norm": 1.9901524782180786,
      "learning_rate": 4.2839973913853604e-05,
      "loss": 0.1745,
      "step": 13500
    },
    {
      "epoch": 1.2287779534673593,
      "grad_norm": 2.0231523513793945,
      "learning_rate": 4.262258936057886e-05,
      "loss": 0.183,
      "step": 13600
    },
    {
      "epoch": 1.2378134176643325,
      "grad_norm": 2.097205877304077,
      "learning_rate": 4.240520480730412e-05,
      "loss": 0.1795,
      "step": 13700
    },
    {
      "epoch": 1.2468488818613057,
      "grad_norm": 1.8367393016815186,
      "learning_rate": 4.218782025402937e-05,
      "loss": 0.1746,
      "step": 13800
    },
    {
      "epoch": 1.2558843460582787,
      "grad_norm": 2.2997806072235107,
      "learning_rate": 4.197043570075463e-05,
      "loss": 0.1781,
      "step": 13900
    },
    {
      "epoch": 1.264919810255252,
      "grad_norm": 1.9972946643829346,
      "learning_rate": 4.1753051147479886e-05,
      "loss": 0.1787,
      "step": 14000
    },
    {
      "epoch": 1.264919810255252,
      "eval_loss": 0.10852447897195816,
      "eval_runtime": 88.2121,
      "eval_samples_per_second": 48.327,
      "eval_steps_per_second": 0.76,
      "eval_wer": 0.11862713845499948,
      "step": 14000
    },
    {
      "epoch": 1.273955274452225,
      "grad_norm": 1.9734628200531006,
      "learning_rate": 4.153566659420514e-05,
      "loss": 0.178,
      "step": 14100
    },
    {
      "epoch": 1.282990738649198,
      "grad_norm": 2.0544159412384033,
      "learning_rate": 4.1318282040930405e-05,
      "loss": 0.1704,
      "step": 14200
    },
    {
      "epoch": 1.2920262028461713,
      "grad_norm": 1.8968679904937744,
      "learning_rate": 4.1100897487655655e-05,
      "loss": 0.1772,
      "step": 14300
    },
    {
      "epoch": 1.3010616670431443,
      "grad_norm": 1.8103258609771729,
      "learning_rate": 4.088351293438092e-05,
      "loss": 0.179,
      "step": 14400
    },
    {
      "epoch": 1.3100971312401175,
      "grad_norm": 1.9365414381027222,
      "learning_rate": 4.0666128381106174e-05,
      "loss": 0.1775,
      "step": 14500
    },
    {
      "epoch": 1.3191325954370905,
      "grad_norm": 1.9121586084365845,
      "learning_rate": 4.044874382783143e-05,
      "loss": 0.1772,
      "step": 14600
    },
    {
      "epoch": 1.3281680596340637,
      "grad_norm": 2.0764715671539307,
      "learning_rate": 4.023135927455669e-05,
      "loss": 0.1719,
      "step": 14700
    },
    {
      "epoch": 1.337203523831037,
      "grad_norm": 1.9687429666519165,
      "learning_rate": 4.0013974721281944e-05,
      "loss": 0.1735,
      "step": 14800
    },
    {
      "epoch": 1.34623898802801,
      "grad_norm": 2.0690395832061768,
      "learning_rate": 3.97965901680072e-05,
      "loss": 0.1797,
      "step": 14900
    },
    {
      "epoch": 1.355274452224983,
      "grad_norm": 2.121548891067505,
      "learning_rate": 3.9579205614732456e-05,
      "loss": 0.1771,
      "step": 15000
    },
    {
      "epoch": 1.355274452224983,
      "eval_loss": 0.10677234828472137,
      "eval_runtime": 88.6946,
      "eval_samples_per_second": 48.064,
      "eval_steps_per_second": 0.755,
      "eval_wer": 0.11541812772287749,
      "step": 15000
    },
    {
      "epoch": 1.364309916421956,
      "grad_norm": 2.3323662281036377,
      "learning_rate": 3.936182106145772e-05,
      "loss": 0.173,
      "step": 15100
    },
    {
      "epoch": 1.3733453806189293,
      "grad_norm": 2.262308359146118,
      "learning_rate": 3.914443650818297e-05,
      "loss": 0.1723,
      "step": 15200
    },
    {
      "epoch": 1.3823808448159025,
      "grad_norm": 2.0854151248931885,
      "learning_rate": 3.892705195490823e-05,
      "loss": 0.1753,
      "step": 15300
    },
    {
      "epoch": 1.3914163090128755,
      "grad_norm": 2.0246262550354004,
      "learning_rate": 3.870966740163348e-05,
      "loss": 0.1742,
      "step": 15400
    },
    {
      "epoch": 1.4004517732098487,
      "grad_norm": 2.0298593044281006,
      "learning_rate": 3.8492282848358745e-05,
      "loss": 0.1727,
      "step": 15500
    },
    {
      "epoch": 1.4094872374068217,
      "grad_norm": 1.8497194051742554,
      "learning_rate": 3.8274898295084e-05,
      "loss": 0.1738,
      "step": 15600
    },
    {
      "epoch": 1.418522701603795,
      "grad_norm": 2.052497386932373,
      "learning_rate": 3.805751374180925e-05,
      "loss": 0.1719,
      "step": 15700
    },
    {
      "epoch": 1.427558165800768,
      "grad_norm": 1.948426604270935,
      "learning_rate": 3.7840129188534514e-05,
      "loss": 0.1692,
      "step": 15800
    },
    {
      "epoch": 1.436593629997741,
      "grad_norm": 2.078310012817383,
      "learning_rate": 3.762274463525977e-05,
      "loss": 0.1736,
      "step": 15900
    },
    {
      "epoch": 1.4456290941947143,
      "grad_norm": 1.8413662910461426,
      "learning_rate": 3.740536008198503e-05,
      "loss": 0.1728,
      "step": 16000
    },
    {
      "epoch": 1.4456290941947143,
      "eval_loss": 0.10456942021846771,
      "eval_runtime": 88.873,
      "eval_samples_per_second": 47.967,
      "eval_steps_per_second": 0.754,
      "eval_wer": 0.11354797577303156,
      "step": 16000
    },
    {
      "epoch": 1.4546645583916873,
      "grad_norm": 1.894006371498108,
      "learning_rate": 3.7187975528710283e-05,
      "loss": 0.1737,
      "step": 16100
    },
    {
      "epoch": 1.4637000225886605,
      "grad_norm": 2.0090203285217285,
      "learning_rate": 3.6970590975435547e-05,
      "loss": 0.1723,
      "step": 16200
    },
    {
      "epoch": 1.4727354867856337,
      "grad_norm": 1.896735668182373,
      "learning_rate": 3.6753206422160796e-05,
      "loss": 0.1744,
      "step": 16300
    },
    {
      "epoch": 1.4817709509826067,
      "grad_norm": 1.9422425031661987,
      "learning_rate": 3.653582186888606e-05,
      "loss": 0.1662,
      "step": 16400
    },
    {
      "epoch": 1.49080641517958,
      "grad_norm": 2.205997943878174,
      "learning_rate": 3.6318437315611316e-05,
      "loss": 0.1726,
      "step": 16500
    },
    {
      "epoch": 1.4998418793765529,
      "grad_norm": 2.2248659133911133,
      "learning_rate": 3.6101052762336565e-05,
      "loss": 0.1739,
      "step": 16600
    },
    {
      "epoch": 1.508877343573526,
      "grad_norm": 1.9154504537582397,
      "learning_rate": 3.588366820906183e-05,
      "loss": 0.1751,
      "step": 16700
    },
    {
      "epoch": 1.5179128077704993,
      "grad_norm": 3.7510364055633545,
      "learning_rate": 3.566845750131983e-05,
      "loss": 0.1691,
      "step": 16800
    },
    {
      "epoch": 1.5269482719674723,
      "grad_norm": 1.9326035976409912,
      "learning_rate": 3.545107294804509e-05,
      "loss": 0.1736,
      "step": 16900
    },
    {
      "epoch": 1.5359837361644455,
      "grad_norm": 2.1534535884857178,
      "learning_rate": 3.5233688394770345e-05,
      "loss": 0.1714,
      "step": 17000
    },
    {
      "epoch": 1.5359837361644455,
      "eval_loss": 0.10288450121879578,
      "eval_runtime": 88.7852,
      "eval_samples_per_second": 48.015,
      "eval_steps_per_second": 0.755,
      "eval_wer": 0.11522686218255233,
      "step": 17000
    },
    {
      "epoch": 1.5450192003614185,
      "grad_norm": 2.0503385066986084,
      "learning_rate": 3.50163038414956e-05,
      "loss": 0.1697,
      "step": 17100
    },
    {
      "epoch": 1.5540546645583917,
      "grad_norm": 2.1852426528930664,
      "learning_rate": 3.479891928822086e-05,
      "loss": 0.1687,
      "step": 17200
    },
    {
      "epoch": 1.563090128755365,
      "grad_norm": 1.9237619638442993,
      "learning_rate": 3.4581534734946115e-05,
      "loss": 0.1699,
      "step": 17300
    },
    {
      "epoch": 1.572125592952338,
      "grad_norm": 1.9139324426651,
      "learning_rate": 3.436415018167137e-05,
      "loss": 0.1721,
      "step": 17400
    },
    {
      "epoch": 1.581161057149311,
      "grad_norm": 1.8762294054031372,
      "learning_rate": 3.414676562839663e-05,
      "loss": 0.1682,
      "step": 17500
    },
    {
      "epoch": 1.590196521346284,
      "grad_norm": 1.6753225326538086,
      "learning_rate": 3.392938107512189e-05,
      "loss": 0.1648,
      "step": 17600
    },
    {
      "epoch": 1.5992319855432573,
      "grad_norm": 2.4316673278808594,
      "learning_rate": 3.371199652184715e-05,
      "loss": 0.1701,
      "step": 17700
    },
    {
      "epoch": 1.6082674497402305,
      "grad_norm": 1.9219187498092651,
      "learning_rate": 3.34946119685724e-05,
      "loss": 0.1669,
      "step": 17800
    },
    {
      "epoch": 1.6173029139372035,
      "grad_norm": 1.6715503931045532,
      "learning_rate": 3.327722741529766e-05,
      "loss": 0.1675,
      "step": 17900
    },
    {
      "epoch": 1.6263383781341767,
      "grad_norm": 1.9405934810638428,
      "learning_rate": 3.3059842862022916e-05,
      "loss": 0.1706,
      "step": 18000
    },
    {
      "epoch": 1.6263383781341767,
      "eval_loss": 0.10067987442016602,
      "eval_runtime": 89.3754,
      "eval_samples_per_second": 47.698,
      "eval_steps_per_second": 0.75,
      "eval_wer": 0.11174157900329401,
      "step": 18000
    },
    {
      "epoch": 1.6353738423311497,
      "grad_norm": 2.1481971740722656,
      "learning_rate": 3.284245830874817e-05,
      "loss": 0.1668,
      "step": 18100
    },
    {
      "epoch": 1.644409306528123,
      "grad_norm": 2.29831600189209,
      "learning_rate": 3.262507375547343e-05,
      "loss": 0.1683,
      "step": 18200
    },
    {
      "epoch": 1.653444770725096,
      "grad_norm": 1.698500633239746,
      "learning_rate": 3.2407689202198685e-05,
      "loss": 0.1651,
      "step": 18300
    },
    {
      "epoch": 1.662480234922069,
      "grad_norm": 2.0010197162628174,
      "learning_rate": 3.219030464892394e-05,
      "loss": 0.1647,
      "step": 18400
    },
    {
      "epoch": 1.671515699119042,
      "grad_norm": 1.8577830791473389,
      "learning_rate": 3.19729200956492e-05,
      "loss": 0.1649,
      "step": 18500
    },
    {
      "epoch": 1.6805511633160153,
      "grad_norm": 2.0325686931610107,
      "learning_rate": 3.175553554237446e-05,
      "loss": 0.1664,
      "step": 18600
    },
    {
      "epoch": 1.6895866275129885,
      "grad_norm": 1.8574236631393433,
      "learning_rate": 3.153815098909972e-05,
      "loss": 0.1646,
      "step": 18700
    },
    {
      "epoch": 1.6986220917099617,
      "grad_norm": 1.94573175907135,
      "learning_rate": 3.1320766435824974e-05,
      "loss": 0.1623,
      "step": 18800
    },
    {
      "epoch": 1.7076575559069347,
      "grad_norm": 1.9908078908920288,
      "learning_rate": 3.1103381882550224e-05,
      "loss": 0.1632,
      "step": 18900
    },
    {
      "epoch": 1.7166930201039077,
      "grad_norm": 1.7018805742263794,
      "learning_rate": 3.088599732927549e-05,
      "loss": 0.163,
      "step": 19000
    },
    {
      "epoch": 1.7166930201039077,
      "eval_loss": 0.09983944892883301,
      "eval_runtime": 88.5039,
      "eval_samples_per_second": 48.167,
      "eval_steps_per_second": 0.757,
      "eval_wer": 0.10740622675592391,
      "step": 19000
    },
    {
      "epoch": 1.7257284843008809,
      "grad_norm": 1.8709958791732788,
      "learning_rate": 3.066861277600074e-05,
      "loss": 0.163,
      "step": 19100
    },
    {
      "epoch": 1.734763948497854,
      "grad_norm": 2.1051034927368164,
      "learning_rate": 3.0451228222726e-05,
      "loss": 0.1632,
      "step": 19200
    },
    {
      "epoch": 1.7437994126948273,
      "grad_norm": 2.1160008907318115,
      "learning_rate": 3.0233843669451256e-05,
      "loss": 0.1677,
      "step": 19300
    },
    {
      "epoch": 1.7528348768918003,
      "grad_norm": 1.7885472774505615,
      "learning_rate": 3.0016459116176512e-05,
      "loss": 0.1628,
      "step": 19400
    },
    {
      "epoch": 1.7618703410887733,
      "grad_norm": 1.7749061584472656,
      "learning_rate": 2.9799074562901772e-05,
      "loss": 0.1623,
      "step": 19500
    },
    {
      "epoch": 1.7709058052857465,
      "grad_norm": 1.933435320854187,
      "learning_rate": 2.958169000962703e-05,
      "loss": 0.1639,
      "step": 19600
    },
    {
      "epoch": 1.7799412694827197,
      "grad_norm": 1.7979782819747925,
      "learning_rate": 2.9364305456352285e-05,
      "loss": 0.1581,
      "step": 19700
    },
    {
      "epoch": 1.788976733679693,
      "grad_norm": 1.9905706644058228,
      "learning_rate": 2.914692090307754e-05,
      "loss": 0.1623,
      "step": 19800
    },
    {
      "epoch": 1.7980121978766659,
      "grad_norm": 2.146162271499634,
      "learning_rate": 2.8929536349802798e-05,
      "loss": 0.1632,
      "step": 19900
    },
    {
      "epoch": 1.8070476620736389,
      "grad_norm": 1.861401081085205,
      "learning_rate": 2.8712151796528054e-05,
      "loss": 0.1613,
      "step": 20000
    },
    {
      "epoch": 1.8070476620736389,
      "eval_loss": 0.09824151545763016,
      "eval_runtime": 87.8053,
      "eval_samples_per_second": 48.551,
      "eval_steps_per_second": 0.763,
      "eval_wer": 0.10753373711614068,
      "step": 20000
    },
    {
      "epoch": 1.816083126270612,
      "grad_norm": 1.8411866426467896,
      "learning_rate": 2.849476724325331e-05,
      "loss": 0.165,
      "step": 20100
    },
    {
      "epoch": 1.8251185904675853,
      "grad_norm": 1.7575931549072266,
      "learning_rate": 2.827738268997857e-05,
      "loss": 0.1564,
      "step": 20200
    },
    {
      "epoch": 1.8341540546645585,
      "grad_norm": 2.028254985809326,
      "learning_rate": 2.8059998136703827e-05,
      "loss": 0.1589,
      "step": 20300
    },
    {
      "epoch": 1.8431895188615315,
      "grad_norm": 1.9810631275177002,
      "learning_rate": 2.7842613583429083e-05,
      "loss": 0.1586,
      "step": 20400
    },
    {
      "epoch": 1.8522249830585045,
      "grad_norm": 1.8610142469406128,
      "learning_rate": 2.7625229030154343e-05,
      "loss": 0.1602,
      "step": 20500
    },
    {
      "epoch": 1.8612604472554777,
      "grad_norm": 1.9897997379302979,
      "learning_rate": 2.74078444768796e-05,
      "loss": 0.1625,
      "step": 20600
    },
    {
      "epoch": 1.8702959114524509,
      "grad_norm": 1.7494564056396484,
      "learning_rate": 2.7190459923604856e-05,
      "loss": 0.1593,
      "step": 20700
    },
    {
      "epoch": 1.879331375649424,
      "grad_norm": 1.9486002922058105,
      "learning_rate": 2.6975249215862856e-05,
      "loss": 0.1595,
      "step": 20800
    },
    {
      "epoch": 1.888366839846397,
      "grad_norm": 1.950518012046814,
      "learning_rate": 2.6757864662588116e-05,
      "loss": 0.1619,
      "step": 20900
    },
    {
      "epoch": 1.89740230404337,
      "grad_norm": 1.9625803232192993,
      "learning_rate": 2.6540480109313373e-05,
      "loss": 0.1568,
      "step": 21000
    },
    {
      "epoch": 1.89740230404337,
      "eval_loss": 0.09674616158008575,
      "eval_runtime": 88.8971,
      "eval_samples_per_second": 47.954,
      "eval_steps_per_second": 0.754,
      "eval_wer": 0.10868133035809159,
      "step": 21000
    },
    {
      "epoch": 1.9064377682403433,
      "grad_norm": 1.7447710037231445,
      "learning_rate": 2.632309555603863e-05,
      "loss": 0.1566,
      "step": 21100
    },
    {
      "epoch": 1.9154732324373165,
      "grad_norm": 2.0597004890441895,
      "learning_rate": 2.610571100276389e-05,
      "loss": 0.1594,
      "step": 21200
    },
    {
      "epoch": 1.9245086966342897,
      "grad_norm": 2.045921802520752,
      "learning_rate": 2.5888326449489145e-05,
      "loss": 0.1592,
      "step": 21300
    },
    {
      "epoch": 1.9335441608312627,
      "grad_norm": 1.9995648860931396,
      "learning_rate": 2.56709418962144e-05,
      "loss": 0.1591,
      "step": 21400
    },
    {
      "epoch": 1.9425796250282357,
      "grad_norm": 1.765527367591858,
      "learning_rate": 2.5455731188472406e-05,
      "loss": 0.1578,
      "step": 21500
    },
    {
      "epoch": 1.9516150892252089,
      "grad_norm": 1.8758126497268677,
      "learning_rate": 2.5238346635197665e-05,
      "loss": 0.1577,
      "step": 21600
    },
    {
      "epoch": 1.960650553422182,
      "grad_norm": 1.770780324935913,
      "learning_rate": 2.502096208192292e-05,
      "loss": 0.1584,
      "step": 21700
    },
    {
      "epoch": 1.9696860176191553,
      "grad_norm": 1.8630551099777222,
      "learning_rate": 2.4803577528648175e-05,
      "loss": 0.1548,
      "step": 21800
    },
    {
      "epoch": 1.9787214818161283,
      "grad_norm": 1.8517158031463623,
      "learning_rate": 2.458619297537343e-05,
      "loss": 0.1593,
      "step": 21900
    },
    {
      "epoch": 1.9877569460131013,
      "grad_norm": 1.6973580121994019,
      "learning_rate": 2.436880842209869e-05,
      "loss": 0.1525,
      "step": 22000
    },
    {
      "epoch": 1.9877569460131013,
      "eval_loss": 0.0945153757929802,
      "eval_runtime": 87.5175,
      "eval_samples_per_second": 48.71,
      "eval_steps_per_second": 0.766,
      "eval_wer": 0.10449474019764106,
      "step": 22000
    },
    {
      "epoch": 1.9967924102100745,
      "grad_norm": 2.0748767852783203,
      "learning_rate": 2.4151423868823947e-05,
      "loss": 0.1573,
      "step": 22100
    },
    {
      "epoch": 2.0057826970860626,
      "grad_norm": 1.6151518821716309,
      "learning_rate": 2.3934039315549204e-05,
      "loss": 0.1241,
      "step": 22200
    },
    {
      "epoch": 2.014818161283036,
      "grad_norm": 1.5904980897903442,
      "learning_rate": 2.3716654762274464e-05,
      "loss": 0.1074,
      "step": 22300
    },
    {
      "epoch": 2.023853625480009,
      "grad_norm": 1.4857326745986938,
      "learning_rate": 2.349927020899972e-05,
      "loss": 0.1029,
      "step": 22400
    },
    {
      "epoch": 2.0328890896769822,
      "grad_norm": 1.7787961959838867,
      "learning_rate": 2.3281885655724976e-05,
      "loss": 0.1066,
      "step": 22500
    },
    {
      "epoch": 2.0419245538739554,
      "grad_norm": 1.6591817140579224,
      "learning_rate": 2.3066674947982977e-05,
      "loss": 0.1057,
      "step": 22600
    },
    {
      "epoch": 2.050960018070928,
      "grad_norm": 1.6939488649368286,
      "learning_rate": 2.2849290394708237e-05,
      "loss": 0.1051,
      "step": 22700
    },
    {
      "epoch": 2.0599954822679014,
      "grad_norm": 1.5981281995773315,
      "learning_rate": 2.2631905841433493e-05,
      "loss": 0.1036,
      "step": 22800
    },
    {
      "epoch": 2.0690309464648746,
      "grad_norm": 1.8668162822723389,
      "learning_rate": 2.241452128815875e-05,
      "loss": 0.1063,
      "step": 22900
    },
    {
      "epoch": 2.078066410661848,
      "grad_norm": 1.627382755279541,
      "learning_rate": 2.219713673488401e-05,
      "loss": 0.1063,
      "step": 23000
    },
    {
      "epoch": 2.078066410661848,
      "eval_loss": 0.0966850146651268,
      "eval_runtime": 88.5935,
      "eval_samples_per_second": 48.119,
      "eval_steps_per_second": 0.756,
      "eval_wer": 0.10462225055785783,
      "step": 23000
    },
    {
      "epoch": 2.087101874858821,
      "grad_norm": 1.6317180395126343,
      "learning_rate": 2.1979752181609266e-05,
      "loss": 0.1067,
      "step": 23100
    },
    {
      "epoch": 2.096137339055794,
      "grad_norm": 1.5637694597244263,
      "learning_rate": 2.1762367628334522e-05,
      "loss": 0.1061,
      "step": 23200
    },
    {
      "epoch": 2.105172803252767,
      "grad_norm": 1.561661720275879,
      "learning_rate": 2.154498307505978e-05,
      "loss": 0.1066,
      "step": 23300
    },
    {
      "epoch": 2.11420826744974,
      "grad_norm": 1.570977807044983,
      "learning_rate": 2.132759852178504e-05,
      "loss": 0.1057,
      "step": 23400
    },
    {
      "epoch": 2.1232437316467134,
      "grad_norm": 1.6354864835739136,
      "learning_rate": 2.111021396851029e-05,
      "loss": 0.1061,
      "step": 23500
    },
    {
      "epoch": 2.1322791958436866,
      "grad_norm": 1.6001309156417847,
      "learning_rate": 2.0892829415235548e-05,
      "loss": 0.1038,
      "step": 23600
    },
    {
      "epoch": 2.1413146600406594,
      "grad_norm": 1.7492948770523071,
      "learning_rate": 2.0675444861960808e-05,
      "loss": 0.1051,
      "step": 23700
    },
    {
      "epoch": 2.1503501242376326,
      "grad_norm": 1.7432228326797485,
      "learning_rate": 2.0458060308686064e-05,
      "loss": 0.1029,
      "step": 23800
    },
    {
      "epoch": 2.159385588434606,
      "grad_norm": 1.5974751710891724,
      "learning_rate": 2.024067575541132e-05,
      "loss": 0.1061,
      "step": 23900
    },
    {
      "epoch": 2.168421052631579,
      "grad_norm": 1.8045574426651,
      "learning_rate": 2.0023291202136577e-05,
      "loss": 0.1075,
      "step": 24000
    },
    {
      "epoch": 2.168421052631579,
      "eval_loss": 0.0951407328248024,
      "eval_runtime": 88.9045,
      "eval_samples_per_second": 47.95,
      "eval_steps_per_second": 0.754,
      "eval_wer": 0.10304962278185102,
      "step": 24000
    },
    {
      "epoch": 2.1774565168285522,
      "grad_norm": 1.6032062768936157,
      "learning_rate": 1.9805906648861836e-05,
      "loss": 0.1065,
      "step": 24100
    },
    {
      "epoch": 2.186491981025525,
      "grad_norm": 1.5442743301391602,
      "learning_rate": 1.9588522095587093e-05,
      "loss": 0.1063,
      "step": 24200
    },
    {
      "epoch": 2.195527445222498,
      "grad_norm": 1.6346817016601562,
      "learning_rate": 1.937113754231235e-05,
      "loss": 0.1036,
      "step": 24300
    },
    {
      "epoch": 2.2045629094194714,
      "grad_norm": 1.6535338163375854,
      "learning_rate": 1.9153752989037606e-05,
      "loss": 0.1051,
      "step": 24400
    },
    {
      "epoch": 2.2135983736164446,
      "grad_norm": 1.6055641174316406,
      "learning_rate": 1.8936368435762862e-05,
      "loss": 0.1064,
      "step": 24500
    },
    {
      "epoch": 2.222633837813418,
      "grad_norm": 1.936577558517456,
      "learning_rate": 1.871898388248812e-05,
      "loss": 0.1045,
      "step": 24600
    },
    {
      "epoch": 2.2316693020103906,
      "grad_norm": 1.58518385887146,
      "learning_rate": 1.8501599329213375e-05,
      "loss": 0.1071,
      "step": 24700
    },
    {
      "epoch": 2.240704766207364,
      "grad_norm": 1.73505437374115,
      "learning_rate": 1.8284214775938635e-05,
      "loss": 0.1065,
      "step": 24800
    },
    {
      "epoch": 2.249740230404337,
      "grad_norm": 1.7908620834350586,
      "learning_rate": 1.806683022266389e-05,
      "loss": 0.1065,
      "step": 24900
    },
    {
      "epoch": 2.2587756946013102,
      "grad_norm": 1.654637336730957,
      "learning_rate": 1.7849445669389147e-05,
      "loss": 0.1035,
      "step": 25000
    },
    {
      "epoch": 2.2587756946013102,
      "eval_loss": 0.09359237551689148,
      "eval_runtime": 90.6143,
      "eval_samples_per_second": 47.046,
      "eval_steps_per_second": 0.739,
      "eval_wer": 0.10149824673254702,
      "step": 25000
    },
    {
      "epoch": 2.2678111587982834,
      "grad_norm": 1.6015100479125977,
      "learning_rate": 1.7632061116114407e-05,
      "loss": 0.1062,
      "step": 25100
    },
    {
      "epoch": 2.276846622995256,
      "grad_norm": 1.6547913551330566,
      "learning_rate": 1.741467656283966e-05,
      "loss": 0.1053,
      "step": 25200
    },
    {
      "epoch": 2.2858820871922294,
      "grad_norm": 1.7010306119918823,
      "learning_rate": 1.719729200956492e-05,
      "loss": 0.1041,
      "step": 25300
    },
    {
      "epoch": 2.2949175513892026,
      "grad_norm": 1.8139252662658691,
      "learning_rate": 1.6979907456290176e-05,
      "loss": 0.103,
      "step": 25400
    },
    {
      "epoch": 2.303953015586176,
      "grad_norm": 1.6318985223770142,
      "learning_rate": 1.6762522903015433e-05,
      "loss": 0.104,
      "step": 25500
    },
    {
      "epoch": 2.312988479783149,
      "grad_norm": 1.798727035522461,
      "learning_rate": 1.654513834974069e-05,
      "loss": 0.1055,
      "step": 25600
    },
    {
      "epoch": 2.322023943980122,
      "grad_norm": 1.527917504310608,
      "learning_rate": 1.6327753796465945e-05,
      "loss": 0.106,
      "step": 25700
    },
    {
      "epoch": 2.331059408177095,
      "grad_norm": 1.6333855390548706,
      "learning_rate": 1.6110369243191205e-05,
      "loss": 0.1024,
      "step": 25800
    },
    {
      "epoch": 2.340094872374068,
      "grad_norm": 1.5563682317733765,
      "learning_rate": 1.589298468991646e-05,
      "loss": 0.1031,
      "step": 25900
    },
    {
      "epoch": 2.3491303365710414,
      "grad_norm": 1.6106479167938232,
      "learning_rate": 1.5675600136641718e-05,
      "loss": 0.1056,
      "step": 26000
    },
    {
      "epoch": 2.3491303365710414,
      "eval_loss": 0.09276529401540756,
      "eval_runtime": 88.7242,
      "eval_samples_per_second": 48.048,
      "eval_steps_per_second": 0.755,
      "eval_wer": 0.10132823291892466,
      "step": 26000
    },
    {
      "epoch": 2.3581658007680146,
      "grad_norm": 1.8455883264541626,
      "learning_rate": 1.5458215583366974e-05,
      "loss": 0.1043,
      "step": 26100
    },
    {
      "epoch": 2.3672012649649874,
      "grad_norm": 1.7726097106933594,
      "learning_rate": 1.5240831030092233e-05,
      "loss": 0.1015,
      "step": 26200
    },
    {
      "epoch": 2.3762367291619606,
      "grad_norm": 1.6910566091537476,
      "learning_rate": 1.5023446476817489e-05,
      "loss": 0.1055,
      "step": 26300
    },
    {
      "epoch": 2.385272193358934,
      "grad_norm": 1.642712116241455,
      "learning_rate": 1.4806061923542747e-05,
      "loss": 0.1027,
      "step": 26400
    },
    {
      "epoch": 2.394307657555907,
      "grad_norm": 1.6066936254501343,
      "learning_rate": 1.4588677370268002e-05,
      "loss": 0.1052,
      "step": 26500
    },
    {
      "epoch": 2.4033431217528802,
      "grad_norm": 1.7851406335830688,
      "learning_rate": 1.437129281699326e-05,
      "loss": 0.1029,
      "step": 26600
    },
    {
      "epoch": 2.412378585949853,
      "grad_norm": 1.9918655157089233,
      "learning_rate": 1.4153908263718516e-05,
      "loss": 0.1006,
      "step": 26700
    },
    {
      "epoch": 2.421414050146826,
      "grad_norm": 1.6415534019470215,
      "learning_rate": 1.3936523710443774e-05,
      "loss": 0.1038,
      "step": 26800
    },
    {
      "epoch": 2.4304495143437994,
      "grad_norm": 1.9253250360488892,
      "learning_rate": 1.3719139157169032e-05,
      "loss": 0.1024,
      "step": 26900
    },
    {
      "epoch": 2.4394849785407726,
      "grad_norm": 1.86326265335083,
      "learning_rate": 1.3501754603894287e-05,
      "loss": 0.1019,
      "step": 27000
    },
    {
      "epoch": 2.4394849785407726,
      "eval_loss": 0.09212099760770798,
      "eval_runtime": 88.0292,
      "eval_samples_per_second": 48.427,
      "eval_steps_per_second": 0.761,
      "eval_wer": 0.1000106258633514,
      "step": 27000
    },
    {
      "epoch": 2.448520442737746,
      "grad_norm": 1.7671024799346924,
      "learning_rate": 1.3284370050619545e-05,
      "loss": 0.1026,
      "step": 27100
    },
    {
      "epoch": 2.4575559069347186,
      "grad_norm": 1.7686715126037598,
      "learning_rate": 1.3066985497344802e-05,
      "loss": 0.1041,
      "step": 27200
    },
    {
      "epoch": 2.466591371131692,
      "grad_norm": 1.743655800819397,
      "learning_rate": 1.284960094407006e-05,
      "loss": 0.099,
      "step": 27300
    },
    {
      "epoch": 2.475626835328665,
      "grad_norm": 1.7912476062774658,
      "learning_rate": 1.2632216390795314e-05,
      "loss": 0.1034,
      "step": 27400
    },
    {
      "epoch": 2.484662299525638,
      "grad_norm": 1.5481427907943726,
      "learning_rate": 1.2414831837520572e-05,
      "loss": 0.1037,
      "step": 27500
    },
    {
      "epoch": 2.4936977637226114,
      "grad_norm": 1.5013809204101562,
      "learning_rate": 1.219744728424583e-05,
      "loss": 0.1028,
      "step": 27600
    },
    {
      "epoch": 2.5027332279195846,
      "grad_norm": 1.592502236366272,
      "learning_rate": 1.1980062730971087e-05,
      "loss": 0.1024,
      "step": 27700
    },
    {
      "epoch": 2.5117686921165574,
      "grad_norm": 1.6279585361480713,
      "learning_rate": 1.1762678177696345e-05,
      "loss": 0.1017,
      "step": 27800
    },
    {
      "epoch": 2.5208041563135306,
      "grad_norm": 1.718693733215332,
      "learning_rate": 1.15452936244216e-05,
      "loss": 0.0991,
      "step": 27900
    },
    {
      "epoch": 2.529839620510504,
      "grad_norm": 1.721211314201355,
      "learning_rate": 1.1327909071146858e-05,
      "loss": 0.1004,
      "step": 28000
    },
    {
      "epoch": 2.529839620510504,
      "eval_loss": 0.0911058560013771,
      "eval_runtime": 86.9208,
      "eval_samples_per_second": 49.045,
      "eval_steps_per_second": 0.771,
      "eval_wer": 0.09856550844756136,
      "step": 28000
    },
    {
      "epoch": 2.5388750847074766,
      "grad_norm": 1.708903193473816,
      "learning_rate": 1.1110524517872116e-05,
      "loss": 0.1032,
      "step": 28100
    },
    {
      "epoch": 2.54791054890445,
      "grad_norm": 1.6191095113754272,
      "learning_rate": 1.0893139964597372e-05,
      "loss": 0.1031,
      "step": 28200
    },
    {
      "epoch": 2.556946013101423,
      "grad_norm": 1.5952250957489014,
      "learning_rate": 1.0677929256855375e-05,
      "loss": 0.0991,
      "step": 28300
    },
    {
      "epoch": 2.565981477298396,
      "grad_norm": 1.8054704666137695,
      "learning_rate": 1.0460544703580633e-05,
      "loss": 0.0994,
      "step": 28400
    },
    {
      "epoch": 2.5750169414953694,
      "grad_norm": 1.4976806640625,
      "learning_rate": 1.024316015030589e-05,
      "loss": 0.0988,
      "step": 28500
    },
    {
      "epoch": 2.5840524056923426,
      "grad_norm": 1.6461458206176758,
      "learning_rate": 1.0025775597031147e-05,
      "loss": 0.0989,
      "step": 28600
    },
    {
      "epoch": 2.593087869889316,
      "grad_norm": 1.631536841392517,
      "learning_rate": 9.808391043756405e-06,
      "loss": 0.1001,
      "step": 28700
    },
    {
      "epoch": 2.6021233340862886,
      "grad_norm": 1.8152861595153809,
      "learning_rate": 9.59100649048166e-06,
      "loss": 0.1001,
      "step": 28800
    },
    {
      "epoch": 2.611158798283262,
      "grad_norm": 1.4996885061264038,
      "learning_rate": 9.373621937206918e-06,
      "loss": 0.103,
      "step": 28900
    },
    {
      "epoch": 2.620194262480235,
      "grad_norm": 1.8811280727386475,
      "learning_rate": 9.156237383932176e-06,
      "loss": 0.0992,
      "step": 29000
    },
    {
      "epoch": 2.620194262480235,
      "eval_loss": 0.09040974825620651,
      "eval_runtime": 87.3549,
      "eval_samples_per_second": 48.801,
      "eval_steps_per_second": 0.767,
      "eval_wer": 0.0979917118265859,
      "step": 29000
    },
    {
      "epoch": 2.629229726677208,
      "grad_norm": 1.550436019897461,
      "learning_rate": 8.938852830657433e-06,
      "loss": 0.0997,
      "step": 29100
    },
    {
      "epoch": 2.638265190874181,
      "grad_norm": 1.7116386890411377,
      "learning_rate": 8.721468277382689e-06,
      "loss": 0.1021,
      "step": 29200
    },
    {
      "epoch": 2.647300655071154,
      "grad_norm": 1.8250106573104858,
      "learning_rate": 8.504083724107947e-06,
      "loss": 0.0992,
      "step": 29300
    },
    {
      "epoch": 2.6563361192681274,
      "grad_norm": 1.704163670539856,
      "learning_rate": 8.286699170833203e-06,
      "loss": 0.0974,
      "step": 29400
    },
    {
      "epoch": 2.6653715834651006,
      "grad_norm": 1.7405962944030762,
      "learning_rate": 8.06931461755846e-06,
      "loss": 0.0997,
      "step": 29500
    },
    {
      "epoch": 2.674407047662074,
      "grad_norm": 1.599592685699463,
      "learning_rate": 7.851930064283716e-06,
      "loss": 0.0978,
      "step": 29600
    },
    {
      "epoch": 2.683442511859047,
      "grad_norm": 1.666237711906433,
      "learning_rate": 7.634545511008974e-06,
      "loss": 0.0986,
      "step": 29700
    },
    {
      "epoch": 2.69247797605602,
      "grad_norm": 1.6730016469955444,
      "learning_rate": 7.417160957734231e-06,
      "loss": 0.0958,
      "step": 29800
    },
    {
      "epoch": 2.701513440252993,
      "grad_norm": 1.800661325454712,
      "learning_rate": 7.199776404459488e-06,
      "loss": 0.0967,
      "step": 29900
    },
    {
      "epoch": 2.710548904449966,
      "grad_norm": 1.4267141819000244,
      "learning_rate": 6.982391851184745e-06,
      "loss": 0.1011,
      "step": 30000
    },
    {
      "epoch": 2.710548904449966,
      "eval_loss": 0.08978110551834106,
      "eval_runtime": 92.3004,
      "eval_samples_per_second": 46.186,
      "eval_steps_per_second": 0.726,
      "eval_wer": 0.09784294973966635,
      "step": 30000
    },
    {
      "epoch": 2.719584368646939,
      "grad_norm": 1.7578014135360718,
      "learning_rate": 6.765007297910002e-06,
      "loss": 0.0988,
      "step": 30100
    },
    {
      "epoch": 2.728619832843912,
      "grad_norm": 1.747879981994629,
      "learning_rate": 6.54762274463526e-06,
      "loss": 0.0982,
      "step": 30200
    },
    {
      "epoch": 2.7376552970408854,
      "grad_norm": 1.4880852699279785,
      "learning_rate": 6.330238191360516e-06,
      "loss": 0.0944,
      "step": 30300
    },
    {
      "epoch": 2.7466907612378586,
      "grad_norm": 1.6102066040039062,
      "learning_rate": 6.112853638085773e-06,
      "loss": 0.099,
      "step": 30400
    },
    {
      "epoch": 2.755726225434832,
      "grad_norm": 2.1802284717559814,
      "learning_rate": 5.89546908481103e-06,
      "loss": 0.0963,
      "step": 30500
    },
    {
      "epoch": 2.764761689631805,
      "grad_norm": 1.65652334690094,
      "learning_rate": 5.680258377069035e-06,
      "loss": 0.099,
      "step": 30600
    },
    {
      "epoch": 2.7737971538287782,
      "grad_norm": 1.344401240348816,
      "learning_rate": 5.462873823794291e-06,
      "loss": 0.0979,
      "step": 30700
    },
    {
      "epoch": 2.782832618025751,
      "grad_norm": 1.6446696519851685,
      "learning_rate": 5.245489270519548e-06,
      "loss": 0.0944,
      "step": 30800
    },
    {
      "epoch": 2.791868082222724,
      "grad_norm": 1.529815435409546,
      "learning_rate": 5.028104717244806e-06,
      "loss": 0.0967,
      "step": 30900
    },
    {
      "epoch": 2.8009035464196974,
      "grad_norm": 1.7729915380477905,
      "learning_rate": 4.810720163970063e-06,
      "loss": 0.095,
      "step": 31000
    },
    {
      "epoch": 2.8009035464196974,
      "eval_loss": 0.08919844031333923,
      "eval_runtime": 90.4055,
      "eval_samples_per_second": 47.154,
      "eval_steps_per_second": 0.741,
      "eval_wer": 0.09748167038571884,
      "step": 31000
    },
    {
      "epoch": 2.80993901061667,
      "grad_norm": 1.6226630210876465,
      "learning_rate": 4.59333561069532e-06,
      "loss": 0.0982,
      "step": 31100
    },
    {
      "epoch": 2.8189744748136434,
      "grad_norm": 1.5628806352615356,
      "learning_rate": 4.375951057420576e-06,
      "loss": 0.095,
      "step": 31200
    },
    {
      "epoch": 2.8280099390106166,
      "grad_norm": 1.5284922122955322,
      "learning_rate": 4.158566504145834e-06,
      "loss": 0.0945,
      "step": 31300
    },
    {
      "epoch": 2.83704540320759,
      "grad_norm": 1.9399908781051636,
      "learning_rate": 3.941181950871091e-06,
      "loss": 0.0954,
      "step": 31400
    },
    {
      "epoch": 2.846080867404563,
      "grad_norm": 1.7431321144104004,
      "learning_rate": 3.7237973975963476e-06,
      "loss": 0.0973,
      "step": 31500
    },
    {
      "epoch": 2.855116331601536,
      "grad_norm": 1.4165501594543457,
      "learning_rate": 3.5064128443216044e-06,
      "loss": 0.0954,
      "step": 31600
    },
    {
      "epoch": 2.8641517957985094,
      "grad_norm": 1.8231940269470215,
      "learning_rate": 3.2890282910468617e-06,
      "loss": 0.0969,
      "step": 31700
    },
    {
      "epoch": 2.873187259995482,
      "grad_norm": 1.9092686176300049,
      "learning_rate": 3.0716437377721185e-06,
      "loss": 0.0967,
      "step": 31800
    },
    {
      "epoch": 2.8822227241924554,
      "grad_norm": 1.6101560592651367,
      "learning_rate": 2.8542591844973753e-06,
      "loss": 0.0973,
      "step": 31900
    },
    {
      "epoch": 2.8912581883894286,
      "grad_norm": 1.6077231168746948,
      "learning_rate": 2.636874631222633e-06,
      "loss": 0.0975,
      "step": 32000
    },
    {
      "epoch": 2.8912581883894286,
      "eval_loss": 0.08852633088827133,
      "eval_runtime": 88.8694,
      "eval_samples_per_second": 47.969,
      "eval_steps_per_second": 0.754,
      "eval_wer": 0.096015301243226,
      "step": 32000
    },
    {
      "epoch": 2.9002936525864014,
      "grad_norm": 1.6472060680389404,
      "learning_rate": 2.4194900779478898e-06,
      "loss": 0.0953,
      "step": 32100
    },
    {
      "epoch": 2.9093291167833746,
      "grad_norm": 1.5193005800247192,
      "learning_rate": 2.2021055246731466e-06,
      "loss": 0.0947,
      "step": 32200
    },
    {
      "epoch": 2.918364580980348,
      "grad_norm": 1.3484536409378052,
      "learning_rate": 1.984720971398404e-06,
      "loss": 0.0937,
      "step": 32300
    },
    {
      "epoch": 2.927400045177321,
      "grad_norm": 1.6725506782531738,
      "learning_rate": 1.7673364181236606e-06,
      "loss": 0.0949,
      "step": 32400
    },
    {
      "epoch": 2.936435509374294,
      "grad_norm": 1.5670363903045654,
      "learning_rate": 1.5499518648489175e-06,
      "loss": 0.0928,
      "step": 32500
    },
    {
      "epoch": 2.9454709735712674,
      "grad_norm": 1.5655218362808228,
      "learning_rate": 1.3325673115741747e-06,
      "loss": 0.0923,
      "step": 32600
    },
    {
      "epoch": 2.95450643776824,
      "grad_norm": 1.7287861108779907,
      "learning_rate": 1.1151827582994317e-06,
      "loss": 0.0945,
      "step": 32700
    },
    {
      "epoch": 2.9635419019652134,
      "grad_norm": 1.5101486444473267,
      "learning_rate": 8.977982050246885e-07,
      "loss": 0.0938,
      "step": 32800
    },
    {
      "epoch": 2.9725773661621866,
      "grad_norm": 1.4109468460083008,
      "learning_rate": 6.804136517499457e-07,
      "loss": 0.091,
      "step": 32900
    },
    {
      "epoch": 2.98161283035916,
      "grad_norm": 1.537053108215332,
      "learning_rate": 4.6302909847520263e-07,
      "loss": 0.0963,
      "step": 33000
    },
    {
      "epoch": 2.98161283035916,
      "eval_loss": 0.08801376074552536,
      "eval_runtime": 90.4227,
      "eval_samples_per_second": 47.145,
      "eval_steps_per_second": 0.741,
      "eval_wer": 0.09624907023695675,
      "step": 33000
    },
    {
      "epoch": 2.9906482945561326,
      "grad_norm": 1.575260043144226,
      "learning_rate": 2.47818390733207e-07,
      "loss": 0.0934,
      "step": 33100
    },
    {
      "epoch": 2.9996837587531058,
      "grad_norm": 1.5032224655151367,
      "learning_rate": 3.043383745846402e-08,
      "loss": 0.0941,
      "step": 33200
    },
    {
      "epoch": 2.999774113395076,
      "step": 33201,
      "total_flos": 2.756290459511145e+20,
      "train_loss": 0.20740618139383307,
      "train_runtime": 51184.2268,
      "train_samples_per_second": 83.03,
      "train_steps_per_second": 0.649
    }
  ],
  "logging_steps": 100,
  "max_steps": 33201,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 3,
  "save_steps": 1000,
  "stateful_callbacks": {
    "TrainerControl": {
      "args": {
        "should_epoch_stop": false,
        "should_evaluate": false,
        "should_log": false,
        "should_save": true,
        "should_training_stop": true
      },
      "attributes": {}
    }
  },
  "total_flos": 2.756290459511145e+20,
  "train_batch_size": 32,
  "trial_name": null,
  "trial_params": null
}