谷歌发布新RL方法,性能提升巨大,o1模型已证明 目前,多数大模型不具备自我纠错或能力较差,尤其是在数学和代码领域在给出错误答案后,会一直坚持错误答案,影响模型的准确率。... 小兔子 2024-12-02 1 #大模型 #Gemini #SCoRe #一枝梧桐 #头条 #IT资讯