openai recently published a paper about criticgpt, a version of gpt-4 fine-tuned to critique code generated by chatgpt. when compared with human evaluators, criticgpt catches more bugs and...
openai发布了criticgpt论文,这是gpt-4的一个版本,用于批评chatgpt生成的代码。criticgpt能够发现更多错误并提出更好的批评意见,openai计划使用它来改进未来模型。criticgpt是openai在可扩展监督方面的努力的一部分,旨在解决评估模型输出的问题。研究人员使用criticgpt生成代码的批评意见,并与人类编码人员进行对比。在评估中,80%的ai训练者更喜欢criticgpt的批评意见,表明它可能是rlhf训练数据的良好来源。