曾記得十幾天之前否?那時我們躊躇滿志的跨進了2018,滿懷著對未來的渴望和珍重……然后我們驚奇的發(fā)現(xiàn),2018第一個火起來的詞叫“撒幣”…
不是我說啥,這可真出戲啊。
似乎一夜之間,直播答題和這個叫做“撒幣”的關(guān)鍵詞就火了。王思聰?shù)臎_頂大會、映客的芝士超人、花椒的百萬贏家,一時之間大佬們瘋狂爭當(dāng)“大撒幣”,人民群眾則紛紛出頭想當(dāng)被幣砸到的那個幸運兒。
當(dāng)然了,不管這些平臺們?nèi)绾?ldquo;撒”,最終“幣”還是要回到他們自己口袋里的,畢竟做生意是為了賺錢,搞出來這么大場面當(dāng)然是為了放后招,沒聽說過哪位出題讓人答是為了做慈善的。除非...除非AI化妝成選手,也來答個題,說不定能干到王思聰們沒幣可撒...
畢竟,答題也是講科學(xué)的對不對?
很多人在答題沖關(guān)時,會借助搜索引擎尋找信息,搜索引擎返回的結(jié)果有兩種形式,一種是我們要在返回頁面的中自己繼續(xù)尋找關(guān)鍵的答案,另一種呢,搜索引擎則直接明了的告訴我們答案,比如“長城有多長”,在分秒必爭沖向百萬獎金的途中,簡直獲得了直掛云帆濟滄海的痛快!這背后的功勞主角,就是今天我們要講的知識圖譜。
在由“AI感知”通向“AI理解”的大路上,知識圖譜是被公認的技術(shù)基石。更更重要的是——他能幫你答題啊……
知識圖譜是什么鬼?
知識圖譜這個概念被提出并不算太久,但是要追根溯源理解這個技術(shù)到底是玩什么的,那可能真要往上倒騰幾十年才行。
上世紀40年代,人工智能被提出之后,無數(shù)科學(xué)家們就開始琢磨,到底用什么方式能讓機器模擬出人的智慧呢?琢磨來琢磨去,人對于信息能夠進行關(guān)聯(lián)理解似乎是個路子。所謂信息關(guān)聯(lián),就是人類在接受一個信息后,會把它放在記憶中進行歸納和調(diào)用。比如我們會記住一些信息:橘子屬于水果,檸檬屬于水果,水果的維生素含量高,這樣我們可以推斷,橘子的維生素含量也高。利用這個思路,上世紀50年代末,學(xué)術(shù)界提出了語義網(wǎng)絡(luò)(semantic network)的設(shè)想,打算把數(shù)據(jù)進行結(jié)構(gòu)化的處理,讓單個信息組合成有聯(lián)系、能共鳴的“知識”,語義網(wǎng)常常被看做是知識圖譜的前身。
上世紀80年代,受到多方面刺激的地球人開始了一次AI復(fù)興運動,而這次運動的主角,就是各國開始打造專家系統(tǒng)和知識庫。那時候科學(xué)家們相信,如果把人類大量知識進行邏輯化關(guān)聯(lián)和語義網(wǎng)絡(luò)存儲,最終人類就能打造出全知全能,無所不懂的人工智能,雖然這場運動之后被保留的專家系統(tǒng)不多,但是海量知識構(gòu)成的知識庫卻成為了更有價值的產(chǎn)物。
2012年,基于語義web技術(shù)和Freebase等優(yōu)質(zhì)知識庫,谷歌提出了知識圖譜(Knowledge Graph)概念,所謂知識圖譜,是利用多個來源的數(shù)據(jù),將真實世界中關(guān)于事物的知識、事物之間的關(guān)系,組織成一張巨大的、聯(lián)通的、讓計算機可以去理解的圖結(jié)構(gòu),于是文字不僅僅是文字,而是有了它在現(xiàn)實世界中的具體的含義和關(guān)聯(lián)關(guān)系。在產(chǎn)業(yè)端它為搜索、內(nèi)容推薦和智能問答提供了基礎(chǔ),成為今天AI領(lǐng)域足夠強勢的一個技術(shù)類別。舉個直白的例子吧:
假如你這幾天很好奇一個叫PGone的詞為啥火了,然后你去搜索一下,結(jié)果給你推薦的詞是PGtwo、PGthree...那你就跟沒搜一樣。假如蹦出來兩個詞,一個是賈乃亮一個是地溝油,那么你看完整個故事就了然了嘛...
所謂的知識圖譜,就是讓智能體去理解事物以及他們之間的關(guān)系,并能基于此提供相關(guān)的技術(shù)和服務(wù),比如這里舉例的推薦技術(shù)。