Lê Võ Quyết Thắng's picture

Lê Võ Quyết Thắng

thangvip

·

AI & ML interests

Adapting LLM to specific domain

Recent Activity

updated a dataset 3 days ago

thangvip/my-distiset-404e664b

updated a dataset 8 days ago

AIForge/vietnamese-squad

updated a dataset 10 days ago

thangvip/tvpl-filtered

View all activity

Organizations

thangvip's activity

upvoted a paper 29 days ago

Building and better understanding vision-language models: insights and future directions

Paper • 2408.12637 • Published Aug 22 • 124

upvoted 2 papers 30 days ago

Natural Language Reinforcement Learning

Paper • 2411.14251 • Published Nov 21 • 26

Hymba: A Hybrid-head Architecture for Small Language Models

Paper • 2411.13676 • Published Nov 20 • 39

upvoted a collection about 1 month ago

Tulu 3 Datasets

All datasets released with Tulu 3 -- state of the art open post-training recipes. • 32 items • Updated 28 days ago • 62

upvoted 3 papers about 1 month ago

TÜLU 3: Pushing Frontiers in Open Language Model Post-Training

Paper • 2411.15124 • Published Nov 22 • 56

Chain-of-Thought Reasoning Without Prompting

Paper • 2402.10200 • Published Feb 15 • 104

Stronger Models are NOT Stronger Teachers for Instruction Tuning

Paper • 2411.07133 • Published Nov 11 • 34

upvoted a paper about 2 months ago

Breaking the Memory Barrier: Near Infinite Batch Size Scaling for Contrastive Loss

Paper • 2410.17243 • Published Oct 22 • 89

upvoted 2 papers 2 months ago

From Generalist to Specialist: Adapting Vision Language Models via Task-Specific Visual Instruction Tuning

Paper • 2410.06456 • Published Oct 9 • 35

GenARM: Reward Guided Generation with Autoregressive Reward Model for Test-time Alignment

Paper • 2410.08193 • Published Oct 10 • 3

upvoted 8 papers 3 months ago

Large Language Models as Markov Chains

Paper • 2410.02724 • Published Oct 3 • 30

Promptriever: Instruction-Trained Retrievers Can Be Prompted Like Language Models

Paper • 2409.11136 • Published Sep 17 • 21

Cottention: Linear Transformers With Cosine Attention

Paper • 2409.18747 • Published Sep 27 • 15

Hyper-Connections

Paper • 2409.19606 • Published Sep 29 • 20

TPI-LLM: Serving 70B-scale LLMs Efficiently on Low-resource Edge Devices

Paper • 2410.00531 • Published Oct 1 • 29

On-Policy Distillation of Language Models: Learning from Self-Generated Mistakes

Paper • 2306.13649 • Published Jun 23, 2023 • 17

Can Large Language Models Unlock Novel Scientific Research Ideas?

Paper • 2409.06185 • Published Sep 10 • 12

Can LLMs Generate Novel Research Ideas? A Large-Scale Human Study with 100+ NLP Researchers

Paper • 2409.04109 • Published Sep 6 • 43

upvoted 2 papers 4 months ago

Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming

Paper • 2408.16725 • Published Aug 29 • 52

POA: Pre-training Once for Models of All Sizes

Paper • 2408.01031 • Published Aug 2 • 26