10 用强AI写测评脚本给其他AI打分
商业模式讲究高频打低频,AI讲究高智商打低智商,被打的都是毫无还手之力
春节假期的最后一天,我用gpt5.2 xhigh给之前搞的AI编程2.0测评任务加上了自动测评脚本,这把是正规的benchmark了
脚本正确性一把过,测试case不符合预期让改了一把,接着让给脚本加上自动统计排行榜并自动push的功能,也都是一把过
现在用强AI写代码就是这种感觉,无论任务大小,基本上都只用说需求,提要求,简单地验收效果就ok了,完全不用看代码
10 用强AI写测评脚本给其他AI打分 商业模式讲究高频打低频,AI讲究高智商打低智商,被打的都是毫无还手之力 春节假期的最后一天,我用gpt5.2 xhigh给之前搞的AI编程2.0测评任务加上了自动测评脚本,这把是正规的benchmark了 脚本正确性一把过,测试case不符合预期让改了一把,接着让给脚本加上自动统计排行榜并自动push的功能,也都是一把过 现在用强AI写代码就是这种感觉,无论任务大小,基本上都只用说需求,提要求,简单地验收效果就ok了,完全不用看代码 接下来详细说说我是咋做的 老规矩,直接看聊天记录 开始之前,先/model把模型切到最强的gpt5.2 xhigh 然后直...
10 用强AI写测评脚本给其他AI打分
商业模式讲究高频打低频,AI讲究高智商打低智商,被打的都是毫无还手之力
春节假期的最后一天,我用gpt5.2 xhigh给之前搞的AI编程2.0测评任务加上了自动测评脚本,这把是正规的benchmark了
脚本正确性一把过,测试case不符合预期让改了一把,接着让给脚本加上自动统计排行榜并自动push的功能,也都是一把过
现在用强AI写代码就是这种感觉,无论任务大小,基本上都只用说需求,提要求,简单地验收效果就ok了,完全不用看代码
暂无评论,快来发表你的见解吧