Models
Datasets
Spaces
Posts
Docs
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2312.13558

Smarter LLMs Research

RARR: Researching and Revising What Language Models Say, Using Language Models

Paper • 2210.08726 • Published Oct 17, 2022 • 1
Hypothesis Search: Inductive Reasoning with Language Models

Paper • 2309.05660 • Published Sep 11, 2023 • 1
In-context Learning and Induction Heads

Paper • 2209.11895 • Published Sep 24, 2022 • 2
ReAct: Synergizing Reasoning and Acting in Language Models

Paper • 2210.03629 • Published Oct 6, 2022 • 14

multilingual modelling

Efficient Language Model Training through Cross-Lingual and Progressive Transfer Learning

Paper • 2301.09626 • Published Jan 23, 2023 • 2
Embedding structure matters: Comparing methods to adapt multilingual vocabularies to new languages

Paper • 2309.04679 • Published Sep 9, 2023
An Empirical Study on Cross-lingual Vocabulary Adaptation for Efficient Generative LLM Inference

Paper • 2402.10712 • Published Feb 16
FOCUS: Effective Embedding Initialization for Specializing Pretrained Multilingual Models on a Single Language

Paper • 2305.14481 • Published May 23, 2023 • 1

Linear Self-Attention Approximation via Trainable Feedforward Kernel

Paper • 2211.04076 • Published Nov 8, 2022 • 1
Greenformer: Factorization Toolkit for Efficient Deep Neural Networks

Paper • 2109.06762 • Published Sep 14, 2021 • 1
COMCAT: Towards Efficient Compression and Customization of Attention-Based Vision Models

Paper • 2305.17235 • Published May 26, 2023 • 2
Exploring Low Rank Training of Deep Neural Networks

Paper • 2209.13569 • Published Sep 27, 2022 • 1

Graph Reasoning

Graph-enhanced Large Language Models in Asynchronous Plan Reasoning

Paper • 2402.02805 • Published Feb 5 • 1
Barack's Wife Hillary: Using Knowledge-Graphs for Fact-Aware Language Modeling

Paper • 1906.07241 • Published Jun 17, 2019 • 2
A Latent Space Theory for Emergent Abilities in Large Language Models

Paper • 2304.09960 • Published Apr 19, 2023 • 3
Reasoning on Graphs: Faithful and Interpretable Large Language Model Reasoning

Paper • 2310.01061 • Published Oct 2, 2023 • 2

Deja Vu: Contextual Sparsity for Efficient LLMs at Inference Time

Paper • 2310.17157 • Published Oct 26, 2023 • 11
Dynamic Context Pruning for Efficient and Interpretable Autoregressive Transformers

Paper • 2305.15805 • Published May 25, 2023 • 1
Compress, Then Prompt: Improving Accuracy-Efficiency Trade-off of LLM Inference with Transferable Prompt

Paper • 2305.11186 • Published May 17, 2023 • 1
Composable Sparse Fine-Tuning for Cross-Lingual Transfer

Paper • 2110.07560 • Published Oct 14, 2021 • 1

Company

© Hugging Face

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs