全球首個(gè)多模態(tài)地理科學(xué)大模型發(fā)布
2024/09/20 09:46 來(lái)源:光明日?qǐng)?bào) 閱讀:1.2萬(wàn)
多模態(tài)地理科學(xué)大模型“坤元”(Sigma Geography)19日正式發(fā)布,。這是全球首個(gè)多模態(tài)地理科學(xué)大模型,,由中國(guó)科學(xué)院地理科學(xué)與資源研究所聯(lián)合中國(guó)科學(xué)院青藏高原研究所、中國(guó)科學(xué)院自動(dòng)化研究所等單位共同研發(fā),。
“坤元”首席科學(xué)家,、中國(guó)科學(xué)院地理科學(xué)與資源研究所研究員蘇奮振介紹,,該模型是專注于地理科學(xué)的專業(yè)語(yǔ)言大模型,具備處理地理科學(xué)相關(guān)問(wèn)題的專業(yè)能力,,目前完成了地理學(xué)全譜系高質(zhì)量語(yǔ)料庫(kù)構(gòu)建,、地理科學(xué)語(yǔ)言大模型構(gòu)建、地理科學(xué)研究智導(dǎo)平臺(tái)研發(fā)等工作,,可實(shí)現(xiàn)地理專業(yè)問(wèn)題解答,、地理學(xué)文獻(xiàn)智能分析、地理數(shù)據(jù)資源查詢,、地理數(shù)據(jù)挖掘分析、專題地圖繪制等功能,。
據(jù)了解,,“坤元”具備“懂地理”“精配圖”“知人心”“智生圖”等特點(diǎn)。
懂地理,是指“坤元”建立了涵蓋4大類,、16小類的地理全學(xué)科語(yǔ)料庫(kù),,提供320億詞元供大模型自監(jiān)督學(xué)習(xí),并制作了4萬(wàn)余條高質(zhì)量地理學(xué)指令進(jìn)行模型微調(diào),。相比通用語(yǔ)言大模型,,“坤元”更熟悉地理學(xué)的語(yǔ)言模式、專業(yè)術(shù)語(yǔ)和領(lǐng)域知識(shí),,在地理學(xué)基準(zhǔn)測(cè)試集上的準(zhǔn)確性提升了31.3%,。
精配圖,是指“坤元”可以根據(jù)生成的文字答案檢索不同地理要素,,并匹配地理景觀照片,、專題地圖或示意圖表呈現(xiàn)給提問(wèn)者。
知人心,,是指“坤元”能充分考慮地理知識(shí)愛(ài)好者,、地理學(xué)專業(yè)學(xué)生以及科研人員的地理科學(xué)知識(shí)體系認(rèn)知和表達(dá)差異,以圖文共現(xiàn)的方式給出適配用戶知識(shí)結(jié)構(gòu)的地理學(xué)專業(yè)問(wèn)題解答,。
智生圖,,則是指團(tuán)隊(duì)基于“坤元”開(kāi)發(fā)的科研助手,可以根據(jù)用戶指令完成概念理解,、數(shù)據(jù)獲取,、信息分析、制圖綜合等流程,,最終生成用戶需要的專業(yè)地理圖表,。
“‘坤元’目前主要支持科研用戶,未來(lái)將逐步面向公眾開(kāi)放,?!碧K奮振表示,“坤元”將賦能地理科學(xué)研究,、加速重大地理科學(xué)發(fā)現(xiàn),。未來(lái),研發(fā)團(tuán)隊(duì)將推進(jìn)地圖大模型及地理推理機(jī)研發(fā),,有望讓地理科學(xué)語(yǔ)言大模型讀懂地圖,;將打造地理科研協(xié)作大平臺(tái),以期讓每個(gè)科學(xué)家和科研團(tuán)隊(duì)都可以擁有專屬的地理大模型,,能夠與數(shù)百萬(wàn)科學(xué)家通過(guò)共享數(shù)據(jù),、模型、研究思路等方式協(xié)同工作,。(記者 齊芳)