Edit model card

Ninja-v1-RP-WIP

概要

Local-Novel-LLM-project/Ninja-v1-NSFWをロールプレイ用にLoRAでファインチューニングしたモデルです。

Aratako/Ninja-v1-RPのベースとなるモデルとして利用しています。

プロンプトフォーマット

Vicunaのchat templateを利用してください。また、設定などを渡すシステムプロンプトは最初のUSER: より前に入力されることを想定しています。

また、マルチターンの対話を行う場合各ターンのアシスタントの応答の末尾にeos_tokenを必ずつけてください。

{ロールプレイの指示、世界観・あらすじの説明、キャラの設定など}
USER: {userの最初の入力}
ASSISTANT: 

学習データセット

GPTやLlama2等の出力の学習利用時に問題があるモデルを使って作成されたデータセットは一切使っていません。

日本語データセット

英語データセット

学習の設定

RunpodでGPUサーバを借り、A6000x4で学習を行いました。主な学習パラメータは以下の通りです。

  • lora_r: 128
  • lisa_alpha: 256
  • lora_dropout: 0.05
  • lora_target_modules: ["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj", "lm_head"]
  • learning_rate: 2e-5
  • num_train_epochs: 3 epochs
  • batch_size: 64
  • max_seq_length: 4096
Downloads last month
19
Safetensors
Model size
7.24B params
Tensor type
BF16
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for Aratako/Ninja-v1-RP-WIP

Finetuned
(1)
this model
Finetunes
1 model
Quantizations
2 models

Datasets used to train Aratako/Ninja-v1-RP-WIP