(資料圖片)
9月7日,在2023外灘大會“新一代數(shù)據(jù)底座——探索圖智能的應用與發(fā)展”分論壇上,螞蟻集團帶來了一項融合研究—“大圖模型”(Large Graph Model,簡稱LGM)。這項研究將圖計算與圖學習及大語言模型結合,利用大語言模型的生成能力和圖計算的關聯(lián)關系分析能力,提供更直觀、更全面的信息呈現(xiàn)和更精準的洞察,從而更好地解決海量復雜的數(shù)字化應用難題。目前螞蟻已完成第一階段“生成式異質圖增強”的研究工作,相關成果論文被世界計算機頂會(WWW 2023)收錄。
圖計算是一種強大的數(shù)據(jù)處理技術,可以解決復雜關系網(wǎng)絡中的關聯(lián)性難題,在金融反欺詐、天氣預報、藥物開發(fā),甚至類腦研究領域都有應用,被譽為人工智能“牛鼻子”。大模型是最有可能走向通用人工智能的技術,在某些領域的任務達到了與人類相當甚至更好的表現(xiàn)。
為什么要用尖端技術驅動尖端技術?大語言模型不能獨立完成數(shù)據(jù)分析和挖掘任務嗎? 螞蟻集團高級技術專家劉永超表示,大語言模型可以推理出隱性關聯(lián)關系,但是無法繪制關系圖,而研究數(shù)據(jù)關系需要體現(xiàn)清晰的鏈路,使用圖結構表示更便于理解?!皩⒋笳Z言模型與圖計算結合,就是先從海量信息中邏輯推理,再利用超級計算算出關系,這就類似給人類大腦外接了一臺超級計算機,能力更強了”,劉永超解釋。
在這項研究中,螞蟻集團主要開展了兩項工作。 第一,利用大語言模型豐富圖數(shù)據(jù)。區(qū)別于普通的上下文依賴模型,大語言模型可以根據(jù)現(xiàn)有數(shù)據(jù)生成新的數(shù)據(jù)點。這項工作名為 “生成式異質圖增強”工作,即通過大語言模型來擴展和豐富不同類型的圖數(shù)據(jù)。第二,通過Prompt(一種指令或提示)引導模型學習和發(fā)現(xiàn)特定數(shù)據(jù)特性。例如,設置一個 Prompt“一年內違約3次以上的群體的共同特征”,模型便會生成滿足特定條件的數(shù)據(jù)樣本。這種能力可以加速數(shù)據(jù)分析和特性發(fā)現(xiàn)的過程。
在本場論壇上,國內外圖智能領域的專家和學者還分享了更多熱點進展。加拿大滑鐵盧大學校級教授M. Tamer ?zsu分享了在業(yè)內富有挑戰(zhàn)性的流式圖計算技術。浙江大學計算機學院教授陳華鈞講述了大模型時代知識處理的機遇與挑戰(zhàn)。之江實驗室圖計算研究中心副主任陳紅陽帶來了之江朱雀圖科學計算與生物醫(yī)藥研發(fā)的最新研究。機器之心聯(lián)合創(chuàng)始人、副主編李亞洲認為圖智能和大模型相結合的研究有望為數(shù)據(jù)智能帶來重大提升。
關于人工智能和圖計算的可能性,外灘圖智能論壇匯聚了不同視角的見解,為圖智能發(fā)展描繪了重要的發(fā)展脈絡。