讓人工智能更“懂”人類
2024/11/18 11:21 來源:人民日報 閱讀:1.3萬
上午9時,重慶市渝北區(qū)菲利信科技有限公司的辦公室內,25歲的蔡川軍開始了一天的工作,。電腦屏幕上,一款語言類人工智能大模型正在總結小說《紅樓夢》第四回的內容,。蔡川軍發(fā)現(xiàn),總結中缺少了幾個重要劇情,,便只給了這條結果3分,,并在備注欄中將其缺漏一一列出。
蔡川軍畢業(yè)于重慶郵電大學計算機專業(yè),,目前是一名人工智能大模型訓練師,。他的日常工作就是通過標注數(shù)據(jù)、評判結果,,讓大模型生成的內容越來越精準,。
一個成熟的人工智能大模型,,算法、算力,、數(shù)據(jù)3方面缺一不可,。其中,大量高質量的數(shù)據(jù)有助于不斷提高大模型的準確率,,這離不開訓練師的努力,。他們通過清洗、整合,、標注等操作,,生成滿足機器學習訓練要求的可讀數(shù)據(jù)編碼。
蔡川軍這一上午的工作內容,,是訓練人工智能全文摘要功能,,對大模型的摘要結果進行打分和評價。大模型在收到訓練師的反饋后,,會以此調整算法參數(shù)權重,,不斷優(yōu)化生成結果。對普通用戶而言,,隨著大模型不斷優(yōu)化,,他們會發(fā)現(xiàn)人工智能越來越“懂”人類。
午休過后,,蔡川軍開始進行機器視覺大模型的標注工作,。具體來說,他需要以自己的審美,,對資料庫中的服飾圖片評分,,并對其風格進行判斷。
“這也是數(shù)據(jù)標注的一種,,我如何標注圖片,,人工智能就如何認識這些數(shù)據(jù)?!辈檀ㄜ娨贿咟c擊鼠標一邊說。當人們使用人工智能生成圖片時,,大模型能否理解“穿著西裝的男人”“穿衣風格帥氣的女生”等指令,,給出令人滿意的反饋,就看訓練師的標注質量,。
“訓練師的工作分為標注和質檢兩類,,標注質量較高且穩(wěn)定的訓練師,就能負責質檢任務,?!狈评趴萍紗T工趙楊說,。2019年進入公司的趙楊,剛開始也是一名訓練師,,經(jīng)過多個項目的歷練,,經(jīng)驗豐富的他成長為培訓師,負責新員工的培訓,、標注標準制定等工作,。
去年蔡川軍初入公司時,接受了為期兩周的培訓,,趙楊就為他授過課,。“課程主要包括系統(tǒng)操作,、數(shù)據(jù)分類,、標注規(guī)則等,幫助新入職員工快速上手,?!壁w楊說,“做人工智能大模型訓練師,,我們更看重一個人的專業(yè)知識儲備,。”
沒有經(jīng)過訓練的大模型就像一張白紙,,需要不斷投喂優(yōu)質數(shù)據(jù)才能成長,,這便對訓練師的專業(yè)知識儲備提出了更高要求?!袄?,與醫(yī)療相關的大模型,我們會讓有醫(yī)學背景的員工來訓練數(shù)據(jù),?!壁w楊說。
除了專業(yè)知識,,這項工作有時對訓練師的性格也有要求,。“訓練師的審美,、性格,、思考方式等,都會對人工智能產生影響,。例如一款大模型的定位是用戶的‘伙伴’,,我們就會通過性格測試,優(yōu)先讓具有溫柔、開朗等性格特征的員工參與,?!壁w楊介紹。
在菲利信科技,,像蔡川軍,、趙楊這樣的訓練師有1500多名,他們通過標注數(shù)據(jù),、評判結果,,讓大模型生成的內容越來越精準,助力人工智能行業(yè)發(fā)展,。
近年來,,渝北區(qū)人力資源和社會保障局持續(xù)強化數(shù)字人才培育,突出服務產業(yè),、就業(yè)與人才3個導向,,促進產業(yè)鏈、培訓鏈與就業(yè)鏈銜接,。近3年,,全區(qū)累計從業(yè)人員達3萬人,覆蓋人工智能,、大數(shù)據(jù),、機器人等前沿領域。(記者 王欣悅)