最长支持多少token的embedding?

#8
by cluo - opened

请问下 最长支持多少token的embedding?
是否受限于Bert的512 token限制?

Moka HR SaSS org

是的,受限于基础模型,最大长度支持 512 个 token

谢谢回答,看介绍说这个模型比较适合答案召回的模式?
就是问题/答案这种模式,问题较短,回答较长

Moka HR SaSS org

m3e 在召回(检索)的场景下有很大的优势,当然在相似问题检测等场景也有优势,但是没有那么大。

不过 m3e 在 ReRanking 上面表现不好... 我现在在研究如何提高这个场景的表现

请问,中文里面,每个token是对应一个字还是一个词?

Moka HR SaSS org

一般是一个字

请问下,部署模型对硬件有什么要求

Moka HR SaSS org

对硬件没有什么要求,看您使用的具体场景。CPU,GPU,TPU 均可。

Sign up or log in to comment