10 用强AI写测评脚本给其他AI打分

10 用强AI写测评脚本给其他AI打分商业模式讲究高频打低频，AI讲究高智商打低智商，被打的都是毫无还手之力春节假期的最后一天，我用gpt5.2 xhigh给之前搞的AI编程2.0测评任务加上了自动测评脚本，这把是正规的benchmark了脚本正确性一把过，测试case不符合预期让改了一把，接着让给脚本加上自动统计排行榜并自动push的功能，也都是一把过现在用强AI写代码就是这种感觉，无论任务大小，基本上都只用说需求，提要求，简单地验收效果就ok了，完全不用看代码接下来详细说说我是咋做的老规矩，直接看聊天记录开始之前，先/model把模型切到最强的gpt5.2 xhigh 然后直...

10 用强AI写测评脚本给其他AI打分

商业模式讲究高频打低频，AI讲究高智商打低智商，被打的都是毫无还手之力

春节假期的最后一天，我用gpt5.2 xhigh给之前搞的AI编程2.0测评任务加上了自动测评脚本，这把是正规的benchmark了

脚本正确性一把过，测试case不符合预期让改了一把，接着让给脚本加上自动统计排行榜并自动push的功能，也都是一把过

现在用强AI写代码就是这种感觉，无论任务大小，基本上都只用说需求，提要求，简单地验收效果就ok了，完全不用看代码

评论

提交评论