when using embedding models for zero-shot classification, rephrasing the class label to "this is seriously about 'label'" gives higher accuracy vs. using label alone. but how, and why?
本文讨论了在零样本设置下使用嵌入模型进行分类任务的问题,提出了一种简单但有效的方法。作者通过嵌入模型计算数据和候选标签之间的余弦相似度,并选择最大相似度的标签作为分类结果。实验结果表明,通过重新构造标签可以显著提高零样本分类性能,但在某些情况下效果不理想。
