怎们拿到图片对应的tokens而不是embeding?
outputs = model(pixel_values)
这个输出的outputs是个字典,里面有tokens也有embedding
· Sign up or log in to comment