首頁 > AI資訊 > 行業(yè)動(dòng)態(tài) > 科大訊飛申請(qǐng)開放式問答及多模態(tài)大模型的訓(xùn)練方法、裝置及相關(guān)設(shè)備專利,使得多模態(tài)大模型具備檢測物體空間位置的能力

科大訊飛申請(qǐng)開放式問答及多模態(tài)大模型的訓(xùn)練方法、裝置及相關(guān)設(shè)備專利,使得多模態(tài)大模型具備檢測物體空間位置的能力

新火種    2023-12-19

金融界2023年12月16日消息,據(jù)國家知識(shí)產(chǎn)權(quán)局公告,科大訊飛股份有限公司申請(qǐng)一項(xiàng)名為“開放式問答及多模態(tài)大模型的訓(xùn)練方法、裝置及相關(guān)設(shè)備“,公開號(hào)CN117235232A,申請(qǐng)日期為2023年10月。

專利摘要顯示,本申請(qǐng)公開了一種開放式問答及多模態(tài)大模型的訓(xùn)練方法、裝置及相關(guān)設(shè)備,為了促使多模態(tài)大模型關(guān)注到空間信息,在預(yù)訓(xùn)練階段針對(duì)訓(xùn)練圖像生成了匹配的帶有空間信息的圖像描述文本,空間信息用于表示訓(xùn)練圖像中包含的對(duì)象在訓(xùn)練圖像中的空間位置,采用訓(xùn)練圖像及上述添加有顯性的對(duì)象空間信息的圖像描述文本對(duì)多模態(tài)大模型進(jìn)行預(yù)訓(xùn)練,可以使得多模態(tài)大模型在學(xué)習(xí)圖像和內(nèi)容描述文本的語義對(duì)齊關(guān)系的基礎(chǔ)上,進(jìn)一步關(guān)注到圖像中對(duì)象的空間位置,也即使得多模態(tài)大模型具備檢測物體空間位置的能力。在此基礎(chǔ)上,當(dāng)將多模態(tài)大模型應(yīng)用于開放式問答任務(wù),在回答與空間排布相關(guān)問題時(shí)能夠基于掌握的能力準(zhǔn)確給出正確回答。

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章