(資料圖)
今日,浙江大學(xué)聯(lián)合高等教育出版社、阿里云等發(fā)布基于通義千問7B(70億參數(shù))模型訓(xùn)練的“智海-三樂”教育垂直大模型,該模型已在阿里云靈積平臺(tái)(DashScope)上線服務(wù),開發(fā)者僅需一行代碼即可使用。
據(jù)介紹,此次發(fā)布的“智海-三樂”以阿里云通義千問7B通用模型為基座,基于核心教材、領(lǐng)域論文和學(xué)位論文等語料和專業(yè)指令數(shù)據(jù)集,繼續(xù)預(yù)訓(xùn)練和微調(diào)。“智海-三樂”集成了搜索引擎、計(jì)算引擎和本地知識(shí)庫等功能,將于9月在全國(guó)13所高校應(yīng)用,可提供智能問答、試題生成、學(xué)習(xí)導(dǎo)航、教學(xué)評(píng)估等能力。
浙江大學(xué)教授吳飛透露:“‘智海-三樂’富有創(chuàng)造力,它生成的回答并非教科書已有標(biāo)準(zhǔn)答案,而是模型通過預(yù)測(cè)下一個(gè)token以及人說話、做事的能力合成出來的精彩回答?!?/p>
目前“智海-三樂”已通過阿里云靈積平臺(tái)(DashScope)對(duì)外提供API服務(wù)。借助靈積平臺(tái)的統(tǒng)一SDK接口,“智海-三樂”大模型可獲取云上高效推理能力,方便被開發(fā)者集成。未來,該模型還將基于靈積平臺(tái)提供的高效微調(diào)訓(xùn)練能力、插件框架等配套設(shè)施,系統(tǒng)化的拓展模型覆蓋面和效果。
據(jù)悉,阿里云正積極建設(shè)自研和行業(yè)大模型生態(tài),靈積平臺(tái)已托管了通義千問、Stable Diffusion、ChatGLM-v2、百川、姜子牙、LLaMa2等業(yè)界領(lǐng)先的大模型。不久前,阿里云還在AI模型社區(qū)魔搭ModelScope開源通義千問7B參數(shù)通用模型和對(duì)話模型。