首頁 > AI資訊 > 行業(yè)動態(tài) > DeepMind等摘得杰出論文、IBM超算深藍成經(jīng)典,IJCAI2023獎項公布

DeepMind等摘得杰出論文、IBM超算深藍成經(jīng)典,IJCAI2023獎項公布

新火種    2023-10-29

圖片

2023 IJCAI 論文接收情況如下,其中摘要提交 5120 篇、完整論文提交 4566 篇,最終接收了 643 篇,接收率約為 14%,相較去年的 15% 又有所下降。

圖片

下圖為基于關(guān)鍵詞的提交和接收論文情況,可以看到,機器學(xué)習(xí)和計算機視覺領(lǐng)域提交和接收的論文數(shù)量最多。

圖片

杰出論文獎(Distinguished Papers)
IJCAI 今年評選出了三篇杰出論文獎,獲獎機構(gòu)包括 Google DeepMind 、阿爾伯塔大學(xué)、阿姆斯特丹大學(xué) 、萊比錫大學(xué)等機構(gòu)。
論文 1《Levin Tree Search with Context Models》

圖片

論文地址:https://www.ijcai.org/proceedings/2023/0624.pdf作者:Laurent Orseau 、 Marcus Hutter 、 Levi H. S. Lelis機構(gòu):Google DeepMind 、阿爾伯塔大學(xué)
摘要:Levin 樹搜索 (LTS) 是一種利用策略(動作的概率分布)的搜索算法,并提供了在達到目標節(jié)點之前進行多少擴展的理論保證(guarantee),這取決于策略的質(zhì)量。這種保證可以看作損失函數(shù),研究者將其稱之為 LTS 損失,從而用來優(yōu)化表示策略的神經(jīng)網(wǎng)絡(luò)(LTS+NN)。
本文展示了神經(jīng)網(wǎng)絡(luò)可以替換成從在線壓縮文獻中產(chǎn)生參數(shù)化的上下文模型(LTS+CM)。本文表明, 在這個新模型下 LTS 損失是凸的,它允許使用標準的凸優(yōu)化工具,并且在給定的一組解軌跡的在線設(shè)置中獲得了最優(yōu)參數(shù)的收斂保證 —— 這是神經(jīng)網(wǎng)絡(luò)無法提供的保證。
新的 LTS+CM 算法在幾個基準上優(yōu)于 LTS+NN,包括 Sokoban (Boxoban)、The Witness、STP(the 24-Sliding Tile puzzle)基準。
在 STP 基準上的結(jié)果表明,兩者的差異非常大,即 LTS+NN 無法解決大多數(shù)測試實例,而 LTS+CM 在不到一秒內(nèi)就解決了每個測試實例。此外,LTS+CM 能夠?qū)W習(xí)解決魔方策略,只需要幾百個擴展,從而大大改善了之前的機器學(xué)習(xí)方法。
下表為帶有 Budgeted LTS 的上下文模型:

圖片

論文 2《SAT-Based PAC Learning of Description Logic Concepts》

圖片

論文地址:https://www.ijcai.org/proceedings/2023/0373.pdf作者:Balder ten Cate 、Maurice Funk、Jean Christoph Jung、Carsten Lutz機構(gòu):阿姆斯特丹大學(xué) 、萊比錫大學(xué)等
摘要:在知識表示中,知識庫 (KB) 的手動管理既耗時又昂貴,這使得基于學(xué)習(xí)的知識獲取方法成為一種有吸引力的替代方案。
本文提出了 SPELL,這是一個基于 SAT 的系統(tǒng),可在圖片下實現(xiàn)圖片的有界擬合。
本文在多個數(shù)據(jù)集上評估了 SPELL,結(jié)果表明 SPELL 的運行時間幾乎總是顯著低于 ELTL(EL tree learner)。這意味著 SPELL 可以學(xué)習(xí)比 ELTL 更大的目標查詢。本文還分析了兩種方法的相對優(yōu)勢和劣勢,確定其中一種系統(tǒng)的性能明顯優(yōu)于另一種系統(tǒng)的輸入類別。最后,本文進行了關(guān)于泛化的初步實驗,表明兩個系統(tǒng)都可以很好地泛化到看不見的數(shù)據(jù),即使是在非常小的樣本上。
下圖為 SPELL、ELTL 一些比較結(jié)果:

圖片

論文 3《Safe Reinforcement Learning via Probabilistic Logic Shields》

圖片

論文地址:https://www.ijcai.org/proceedings/2023/0637.pdf作者:Wen-Chi Yang 、 Giuseppe Marra 、 Gavin Rens 、 Luc De Raedt機構(gòu):魯汶大學(xué)、斯泰倫博斯大學(xué)
摘要:安全強化學(xué)習(xí)(Safe RL)旨在保持安全的同時學(xué)習(xí)最優(yōu)策略,它的一種流行解決方案是屏蔽,利用邏輯安全規(guī)范來防止 RL 智能體采取危險的行動。不過,傳統(tǒng)的屏蔽技術(shù)很難與連續(xù)、端到端的深度 RL 方法集成。
研究者提出了概率邏輯策略梯度(Probabilistic Logic Policy Gradient, PLPG),它是一種基于模型的安全 RL 技術(shù),使用概率邏輯編程將邏輯安全約束建模為可微函數(shù)。因此,PLPG 可以無縫地應(yīng)用于任何策略梯度算法,還能提供相同的收斂保證。下圖 1 為概率邏輯屏蔽的示例。

圖片

實驗表明,與其他 SOTA 屏蔽技術(shù)相比,PLPG 可以學(xué)習(xí)更安全、更有價值的策略。
論文一作 Wen-Chi Yang 為魯汶大學(xué) DTAI 研究團隊的博士,致力于通過形式化驗證與機器學(xué)習(xí)的結(jié)合,來提升安全約束可滿足性。她還特別對智能體利用背景知識來安全地學(xué)習(xí)和探索感興趣。本科畢業(yè)于臺灣交通大學(xué),之后進入魯汶大學(xué)攻讀碩士和博士學(xué)位(均為計算機科學(xué))。
個人主頁:https://wenchiyang.github.io/
AIJ 獎
AIJ 的全稱為 Artificial Intelligence Journal,即《人工智能期刊》,始建于 1970 年,是人工智能研究領(lǐng)域的頂級學(xué)術(shù)期刊,具有公認的權(quán)威性與知名性。
AIJ 突出論文獎
2023 年 AIJ 突出論文獎授予 José Camacho-Collados、Mohammad Taher Pilehvar、Roberto Navigli 合著的論文《Nasari: Integrating explicit knowledge and corpus statistics for a multilingual representation of concepts and entities》。該論文發(fā)表于 2016 年。

圖片

論文地址:https://www.sciencedirect.com/science/article/pii/S0004370216300820
摘要:語義表征被認為是 NLP 和 AI 研究中最基本的內(nèi)容,其在過去幾十年中一直是詞匯語義學(xué)的重要研究領(lǐng)域。然而,由于缺乏大型的語義標注語料庫,大多數(shù)現(xiàn)有的表征技術(shù)僅限于詞匯層面,因此無法有效地應(yīng)用于單個單詞的語義。
本文提出了一種新的多語言向量表征,稱為 Nasari,它不僅能夠準確地表征不同語言的詞義,而且與現(xiàn)有方法相比存在兩個優(yōu)點:
高覆蓋率,包括概念和命名實體;跨語言和語言級別(即單詞、意義和概念)的可比性。
此外,Nasari 表征很靈活,可以應(yīng)用于多種應(yīng)用程序,并且可以在網(wǎng)站上免費獲得。該研究在四個不同任務(wù)上進行評估,即單詞相似度、語義聚類、域標記和詞義消歧,結(jié)果顯示,Nasari 表征在所有任務(wù)上表現(xiàn) SOTA。
下表為統(tǒng)一向量構(gòu)造方法:

圖片

AIJ 經(jīng)典論文獎

今年的 AIJ 經(jīng)典論文獎頒給了關(guān)于超級計算機深藍的論文《Deep Blue》。該論文發(fā)表于 2002 年。

圖片

作者:Murray Campbell、A. Joseph Hoane Jr.、Feng-hsiung Hsu機構(gòu):IBM T.J. 沃森研究中心、Sandbridge Technologies、Compaq論文地址:https://core.ac.uk/download/pdf/82416379.pdf
摘要:深藍(Deep Blue)是由 IBM 開發(fā)的專門用以分析國際象棋的超級計算機。其在 1997 年的六場比賽中擊敗了當時的世界象棋冠軍加里?卡斯帕羅夫。促成這一成功的因素有很多,包括:
單芯片國際象棋搜索引擎;具有多層并行性的大規(guī)模并行系統(tǒng);搜索擴展;復(fù)雜評價函數(shù);有效地使用 Grandmaster 游戲數(shù)據(jù)庫。
本文描述了深藍系統(tǒng),并給出了深藍背后設(shè)計決策的一些基本原理。如下為 dual credit 算法。

圖片

IJCAI-JAIR 最佳論文獎
自 2003 年起,IJCAI-JAIR 最佳論文獎每年從最近 5 年發(fā)表在 JAIR 的論文中評選并表彰一篇杰出論文。評審的標準基于論文的重要性和 presentation 的質(zhì)量。
2023 年的 IJCAI-JAIR 最佳論文獎授予了論文《Reward Machines: Exploiting Reward Function Structure in Reinforcement Learning》,作者來自智利天主教大學(xué)、加拿大 AI 研究機構(gòu) Vector Institute、多倫多大學(xué)等。

圖片

論文地址:https://jair.org/index.php/jair/article/view/12440
此前,2023 IJCAI 的「Donald E. Walker 杰出服務(wù)獎」授予了香港科技大學(xué)講座教授楊強,以表彰其對 IJCAI 組織和整個人工智能領(lǐng)域的杰出貢獻。他也成為了該獎項設(shè)置以來首位獲獎的華人科學(xué)家。

圖片

參考鏈接:https://www.ijcai.org/awards
相關(guān)推薦
免責(zé)聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責(zé)任。

熱門文章