Upload model

Browse files

Files changed (3) hide show

README.md +15 -83
adapter_config.json +24 -0
adapter_model.safetensors +3 -0

README.md CHANGED Viewed

@@ -1,89 +1,21 @@
 ---
-base_model: Llama2-7B
-tags:
-- generated_from_trainer
 ---
-# モデル概要
-[meta-llama/Llama-2-7b-hf](https://huggingface.co/meta-llama/Llama-2-7b-hf)を日本語データ（[taka-yayoi/databricks-dolly-15k-ja](https://huggingface.co/datasets/taka-yayoi/databricks-dolly-15k-ja)）を用いてインストラクションチューニングしました．
-# 使用方法
-```python
-import torch
-from peft import PeftModel
-from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
-# モデルの読み込み
-model = AutoModelForCausalLM.from_pretrained(
-    "meta-llama/Llama-2-7b-hf",
-    quantization_config=BitsAndBytesConfig(
-        load_in_4bit=True,
-        bnb_4bit_use_double_quant=True,
-        bnb_4bit_quant_type="nf4",
-        bnb_4bit_compute_dtype=torch.bfloat16
-    ),
-    device_map={"":0}
-)
-# トークナイザーの読み込み
-tokenizer = AutoTokenizer.from_pretrained(
-    "asaoka/Llama-2-7b-hf-qlora-dolly15k-japanese"
-)
-# LoRAの読み込み
-model = PeftModel.from_pretrained(
-    model,
-    "asaoka/Llama-2-7b-hf-qlora-dolly15k-japanese",
-    device_map={"":0}
-)
-model.eval()
-# プロンプトの準備
-prompt = "### Instruction: 富士山とは？\n\n### Response: "
-# 推論の実行
-inputs = tokenizer(prompt, return_tensors="pt").to("cuda:0")
-with torch.no_grad():
-    outputs = model.generate(**inputs, max_new_tokens=100)
-print(tokenizer.decode(outputs[0], skip_special_tokens=True))
-```
-使用方法は，[「Google Colab で Llama-2-7B のQLoRA ファインチューニングを試す」](https://note.com/npaka/n/na7c631175111#f2af0e53-4ef3-4288-b152-6524f1b940a7)を参照しました．
-# トレーニング方法
-- インストラクションチューニング + QLoRA(4bitLoRA)
-- トークナイザー：Llama-2-7b-hfのトークナイザーをそのまま使用
-# JGLUEスコア
-| タスク | Llama-2-7b-hf | This Model |
-|:-|:-|:-|
-| jcommonsenseqa-1.1-0.6(acc) | 0.7274 | ? |
-[JGLUEスコア](https://aclanthology.org/2022.lrec-1.317/)は，Stability AI社の[lm-evaluation-harness](https://github.com/Stability-AI/lm-evaluation-harness)を用いて
-算出しました．JGLUEスコアの算出に用いたスクリプトを下記に示します．
-```bash
-!python main.py \
-    --model hf-causal-experimental \
-    --model_args pretrained=meta-llama/Llama-2-7b-hf \
-    --tasks jcommonsenseqa-1.1-0.6 \
-    --num_fewshot 3 \
-    --device cuda \
-    --output_path ./results.json
-```
-```bash
-!python main.py \
-    --model hf-causal-experimental \
-    --model_args pretrained=meta-llama/Llama-2-7b-hf,peft=asaoka/Llama-2-7b-hf-qlora-dolly15k-japanese \
-    --tasks jcommonsenseqa-1.1-0.6 \
-    --num_fewshot 3 \
-    --device cuda \
-    --output_path ./results.json
-```

 ---
+library_name: peft
 ---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.5.0

adapter_config.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "meta-llama/Llama-2-7b-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 16,
+  "revision": null,
+  "target_modules": [
+    "lm_head",
+    "v_proj",
+    "o_proj",
+    "gate_proj",
+    "up_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

adapter_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:648ea00d3edd16c72bcaf301635ee7e1c7a9a50fc5e58860fbb77166eabf929f
+size 97764808