這種搜索機(jī)制大大提高了AI找到正確解決方案的谷歌概率。讓AI能夠更快地掌握正確的團(tuán)隊(duì)推理模式 。

為了避免AI系統(tǒng)過度擬合訓(xùn)練數(shù)據(jù) ,揭秘這些標(biāo)注員會(huì)仔細(xì)檢查AI生成的何像每一個(gè)推理步驟 。使用過程監(jiān)督強(qiáng)化學(xué)習(xí)訓(xùn)練的人類AI系統(tǒng)將準(zhǔn)確率從原來的41%提升到了73%