中國(guó)信通院聯(lián)合淘天集團(tuán)發(fā)布全球首個(gè)中文安全領(lǐng)域事實(shí)性基準(zhǔn)評(píng)測(cè)集,僅三個(gè)大模型達(dá)及格線(xiàn)
在當(dāng)今迅速發(fā)展的人工智能時(shí)代,大語(yǔ)言模型(LLMs)在各種應(yīng)用中發(fā)揮著至關(guān)重要的作用。然而,隨著其應(yīng)用的廣泛化,模型的安全性問(wèn)題也引起了廣泛關(guān)注。探討如何評(píng)估和提升這些模型在復(fù)雜的法律、政策和倫理領(lǐng)域的安全性,成為了學(xué)術(shù)界和工業(yè)界亟待解決的重要議題。首先,大語(yǔ)言模型的安全性與其對(duì)安全知識(shí)的理解密切相