Csaba Kecskemeti's picture

Csaba Kecskemeti PRO

csabakecskemeti

·

https://devquasar.com/

csabakecskemeti

AI & ML interests

None yet

Recent Activity

updated a model about 5 hours ago

DevQuasar/llama3_8b_chat_brainstorm-GGUF

updated a model about 5 hours ago

DevQuasar/llama3.1_8b_chat_brainstorm-v3.1-GGUF

updated a model about 5 hours ago

DevQuasar/llama3_8b_chat_brainstorm_plus-GGUF

View all activity

Organizations

csabakecskemeti's activity

updated 3 models about 5 hours ago

DevQuasar/llama3_8b_chat_brainstorm-GGUF

Text Generation • Updated about 5 hours ago • 208 • 2

DevQuasar/llama3.1_8b_chat_brainstorm-v3.1-GGUF

Updated about 5 hours ago • 777 • 1

DevQuasar/llama3_8b_chat_brainstorm_plus-GGUF

Text Generation • Updated about 5 hours ago • 384 • 2

updated a model about 10 hours ago

DevQuasar/prithivMLmods.Sombrero-QwQ-32B-Elite10-GGUF

Text Generation • Updated about 10 hours ago

published a model about 14 hours ago

DevQuasar/prithivMLmods.Sombrero-QwQ-32B-Elite10-GGUF

Text Generation • Updated about 10 hours ago

updated a model about 14 hours ago

DevQuasar/prithivMLmods.Bellatrix-Tiny-1B-v2-GGUF

Text Generation • Updated about 14 hours ago

published a model about 14 hours ago

DevQuasar/prithivMLmods.Bellatrix-Tiny-1B-v2-GGUF

Text Generation • Updated about 14 hours ago

updated a model about 14 hours ago

DevQuasar/prithivMLmods.Viper-Coder-v1.7-Vsm6-GGUF

Text Generation • Updated about 14 hours ago

published a model about 16 hours ago

DevQuasar/prithivMLmods.Viper-Coder-v1.7-Vsm6-GGUF

Text Generation • Updated about 14 hours ago

updated a model about 16 hours ago

DevQuasar/prithivMLmods.Messier-Opus-14B-Elite12-GGUF

Text Generation • Updated about 16 hours ago

published a model about 17 hours ago

DevQuasar/prithivMLmods.Messier-Opus-14B-Elite12-GGUF

Text Generation • Updated about 16 hours ago

updated a model about 17 hours ago

DevQuasar/prithivMLmods.Coma-II-14B-GGUF

Text Generation • Updated about 17 hours ago • 89

updated 2 models about 18 hours ago

DevQuasar/prithivMLmods.Coma-II-14B-GGUF

Text Generation • Updated about 17 hours ago • 89

DevQuasar/prithivMLmods.Qwen2-VL-OCR2-2B-Instruct-GGUF

Text Generation • Updated about 18 hours ago • 119

updated a collection about 19 hours ago

Vision-GGUF

9 items • Updated about 19 hours ago • 1

liked a dataset about 19 hours ago

prithivMLmods/AI-vs-Deepfake-vs-Real

Viewer • Updated 15 days ago • 10k • 512 • 14

published 2 models about 19 hours ago

DevQuasar/prithivMLmods.Qwen2-VL-OCR2-2B-Instruct-GGUF

Text Generation • Updated about 18 hours ago • 119

DevQuasar/prithivMLmods.Coma-II-14B-GGUF

Text Generation • Updated about 17 hours ago • 89

updated a model about 20 hours ago

DevQuasar/NousResearch.Hermes-2-Pro-Llama-3-70B-GGUF

Text Generation • Updated about 20 hours ago • 154

replied to their post 1 day ago

No success so far, the training data contains some larger contexts and it fails just before complete the first epoch.
(dataset: DevQuasar/brainstorm-v3.1_vicnua_1k)

If anyone has further suggestion to the bnb config (with ROCm on MI100)?
bnb_config = BitsAndBytesConfig(
load_in_4bit=True,
bnb_4bit_quant_type="nf4",
bnb_4bit_use_double_quant=True,
bnb_4bit_compute_dtype=torch.bfloat16
)

Now testing with my other dataset that is smaller seems I have a lower memory need
DevQuasar/brainstorm_vicuna_1k