10 用強 AI 寫測評腳本給其他 AI 打分
商業模式講究高頻打低頻,AI 講究高智商打低智商,被打的都是毫無還手之力
春節假期的最後一天,我用 gpt5.2 xhigh 給之前搞的 AI 程式設計 2.0 測評任務加上了自動測評腳本,這把是正規的 benchmark 了
腳本正確性一次過,測試 case 不符合預期讓改了一把,接著讓給腳本加上自動統計排行榜並自動 push 的功能,也都是一次過
現在用強 AI 寫程式碼就是這種感覺,無論任務大小,基本上都只用說需求,提要求,簡單地驗收效果就 ok 了,完全不用看程式碼
暫無評論,快來發表你的看法吧