中華經(jīng)典資源庫,、古漢語大語言模型等成果涌現(xiàn) 生僻字更易輸入 文言文更快釋讀
2025/04/09 09:23 來源:人民網(wǎng) 閱讀:2.1萬
“頔”寓意美好,、“燊”表示熾盛,、“鋆”意為金子……古籍里的這些生僻字,,曾因無法輸入電腦,給文化傳承,、學(xué)術(shù)研究,乃至人們?nèi)粘I顜聿槐?。?shù)字時(shí)代,,如何讓漢語言文字更完整地活躍在“云”端,?
日前,,教育部圍繞推進(jìn)語言文字信息化發(fā)展舉辦新聞發(fā)布會(huì),?!皬摹U與火’到‘光與電’,,中文信息處理技術(shù)不斷創(chuàng)新發(fā)展?!北本┐髮W(xué)王選研究所所長(zhǎng)湯幟介紹,北京大學(xué)作為國(guó)家語委中文文字字體設(shè)計(jì)與研究中心的依托單位,,設(shè)計(jì)開發(fā)國(guó)家重大基礎(chǔ)性規(guī)范《通用規(guī)范漢字表》的配套字庫,研制人口信息生僻字超大字庫解決方案,,在第二代居民身份證,、護(hù)照上應(yīng)用,協(xié)助解決銀行,、稅務(wù)等社會(huì)應(yīng)用系統(tǒng)的人名、地名缺字問題,。
語言文字信息化是經(jīng)濟(jì)社會(huì)信息化的重要組成部分,,是數(shù)字中國(guó)建設(shè)的基礎(chǔ)性工作,。記者了解到,近年來,,教育部聯(lián)合有關(guān)部門發(fā)布了國(guó)家通用語言文字和民族語言文字信息化規(guī)范標(biāo)準(zhǔn)100多項(xiàng),,推動(dòng)建成國(guó)家語委媒體語言語料庫、冬奧會(huì)多語言術(shù)語庫等,,上線國(guó)家語言資源服務(wù)平臺(tái),、中國(guó)語言文字?jǐn)?shù)字博物館等,持續(xù)推動(dòng)語言文化資源共建共享,。
隨著智慧化學(xué)習(xí)的廣泛開展,,語言文化優(yōu)質(zhì)資源惠及更多人。教育部語言文字信息管理司司長(zhǎng)劉培俊介紹,,為推進(jìn)語教融合,,教育部打造“中華經(jīng)典資源庫”,總瀏覽量超6000萬,;打造“中小學(xué)語文示范誦讀庫”,,惠及全國(guó)約1.6億中小學(xué)生和上千萬教師及社會(huì)大眾;上線中國(guó)語言文字?jǐn)?shù)字博物館,,收納海量資源,,構(gòu)建全民學(xué)習(xí)新課堂。
此外,,數(shù)智賦能也讓國(guó)家通用語言文字推廣普及效率不斷提升,。目前,普通話測(cè)試方式已實(shí)現(xiàn)從人工到智能的轉(zhuǎn)變,,機(jī)輔測(cè)試已服務(wù)超過9200萬人次,。廣東省教育廳副廳長(zhǎng)朱建華介紹:“我們支持研發(fā)普通話水平智能測(cè)試艙、聲紋分析系統(tǒng)等,,打造了全國(guó)首個(gè)以智能化為核心的普通話水平測(cè)試智慧考場(chǎng),,能夠做到‘隨到隨考’?!?/p>
語言文字信息化讓古籍里的文字展現(xiàn)出新的活力,。打開“AI太炎”古漢語大語言模型,,輸入待分析的古籍文本,系統(tǒng)便能根據(jù)用戶選擇進(jìn)行釋讀,,包括字詞釋義、文白翻譯,、句讀標(biāo)點(diǎn),、用典分析等。北京師范大學(xué)黨委常委,、副校長(zhǎng)康震介紹,,“‘AI太炎’依靠自主可控、安全可信的技術(shù)路線,,理解力強(qiáng),、準(zhǔn)確率高,,能夠高質(zhì)量完成多種文言文理解任務(wù),目前已廣泛應(yīng)用于學(xué)術(shù)科研,、基礎(chǔ)教育,、編輯出版等多個(gè)領(lǐng)域,?!?/p>
近日,教育部,、國(guó)家語委、中央網(wǎng)信辦共同印發(fā)《關(guān)于加強(qiáng)數(shù)字中文建設(shè) 推進(jìn)語言文字信息化發(fā)展的意見》。意見提出創(chuàng)新應(yīng)用自然語言處理,、大語言模型、多模態(tài)信息處理,、知識(shí)圖譜、語料加工等5項(xiàng)前沿技術(shù),。
“我們要將數(shù)字中文建設(shè)作為全面推進(jìn)語言文字信息化發(fā)展的突出重點(diǎn),,服務(wù)大語言模型等人工智能技術(shù)創(chuàng)新應(yīng)用‘制高點(diǎn)’,,夯實(shí)國(guó)家關(guān)鍵語料基礎(chǔ)設(shè)施‘新基建’,,全方位釋放語言文字在經(jīng)濟(jì)社會(huì)發(fā)展中的數(shù)據(jù)要素價(jià)值,?!眲⑴嗫≌f,。(記者 丁雅誦)