
Upload llama_7b_seq8k_bs2M_skyladder_500B/train_state_00063.json with huggingface_hub
2f9ad92
verified
- code_tiny_LLaMA_1b_32k_code_32k
- code_tiny_LLaMA_1b_32k_dm2_code_32k
- code_tiny_LLaMA_1b_8k_code_8k
- code_tiny_LLaMA_1b_8k_dm8_code_8k
- code_tiny_LLaMA_1b_8k_intradm8_code_8k
- llama3.2_3b_8k_dm4_cc_8k
- llama3.2_3b_8k_dm8_cc_8k
- llama3.2_3b_8k_intradm2_cc_8k
- llama3.2_3b_8k_intramask_cc_8k
- llama3.2coder_3b_8k_cc_8k
- llama3.2coder_3b_8k_dm8_cc_8k
- llama_7b_seq8k_bs2M_500B
- llama_7b_seq8k_bs2M_skyladder_500B
- tiny_LLaMA_1b_32k_cc_32k
- tiny_LLaMA_1b_32k_cc_32k_from_cc_32k
- tiny_LLaMA_1b_32k_cc_32k_from_dm2_32k
- tiny_LLaMA_1b_32k_cc_32k_load
- tiny_LLaMA_1b_32k_ccrope_32k
- tiny_LLaMA_1b_32k_dm2_cc_32k
- tiny_LLaMA_1b_32k_dm2_cc_32k_from_cc_32k
- tiny_LLaMA_1b_32k_dm2_cc_32k_from_dm2_32k
- tiny_LLaMA_1b_32k_dm2_cc_32k_load
- tiny_LLaMA_1b_32k_dm2_ccrope_32k
- tiny_LLaMA_1b_32k_dm2inc1024_cc_32k
- tiny_LLaMA_1b_32k_exp2_cc_32k
- tiny_LLaMA_1b_32k_exp2inc1024_cc_32k
- tiny_LLaMA_1b_32k_intradm1_cc_32k
- tiny_LLaMA_1b_32k_intradm2_cc_32k
- tiny_LLaMA_1b_32k_intramask_cc_32k
- tiny_LLaMA_1b_32k_sc4_cc_32k
- tiny_LLaMA_1b_32k_sin2_cc_32k
- tiny_LLaMA_1b_8k_cc_8k
- tiny_LLaMA_1b_8k_dm16_cc_8k
- tiny_LLaMA_1b_8k_dm1_cc_8k
- tiny_LLaMA_1b_8k_dm2_cc_8k
- tiny_LLaMA_1b_8k_dm32_cc_8k
- tiny_LLaMA_1b_8k_dm4_cc_8k
- tiny_LLaMA_1b_8k_intradm1_cc_8k
- tiny_LLaMA_1b_8k_intradm2_cc_8k
- tiny_LLaMA_1b_8k_intradm4_cc_8k
- tiny_LLaMA_1b_8k_intramask_cc_8k
- tiny_LLaMA_1b_8k_inv8_cc_8k
- tiny_LLaMA_1b_8k_lin80p_cc_8k_100b_tokens
- tiny_LLaMA_1b_8k_lin80p_cc_8k_200b_tokens
- tiny_LLaMA_1b_8k_lin80p_cc_8k_50b_tokens
- tiny_LLaMA_1b_8k_lin90p_cc_8k_100b_tokens
- tiny_LLaMA_1b_8k_lin90p_cc_8k_200b_tokens
- tiny_LLaMA_1b_8k_lin90p_cc_8k_50b_tokens
- tiny_LLaMA_1b_8k_lin95p_cc_8k_100b_tokens
- tiny_LLaMA_1b_8k_lin95p_cc_8k_200b_tokens