3月18日,成都市國家數據標注基地牧山園區(qū)正式開園,標志著我國西南地區(qū)在數據要素市場化配置和產業(yè)數字化轉型領域邁出關鍵一步。中國電信四川公司作為聯合建設單位,發(fā)布系列AI+四川方言創(chuàng)新應用,聚焦數據標注、數據服務、人工智能、可信數據空間等領域,助力打造國家級數據標注試點基地。
以標注為支點,撬動AI賦能千行百業(yè)
作為全國首批數據標注基地建設城市之一,成都2024年8月便啟動了牧山園區(qū)建設項目。建設過程中,中國電信四川公司為基地配備通用數據標注工具和AI智能標注工具,支持圖像、視頻、音頻、文本、點云等多模態(tài)數據標注。通用工具涵蓋語音轉錄、實體關系標注、2D/3D框標注等基礎功能;AI工具則依托大語言模型實現目標自動檢測、ASR自動化標注等智能功能,大幅提升標注效率與質量。
在人工智能應用和數據流通領域,基地提供標訓推一體化能力,預置近200種算法模型、多個行業(yè)數據集,支持第三方能力接入和對話式交互構建應用。依托區(qū)塊鏈、隱私計算等新技術,基地打造高質量數據集流通市場,提供統(tǒng)一交易門戶和全流程業(yè)務支持,覆蓋從審核上架到交付結算的完整鏈條,有效促進數據價值變現。
“以文旅為例,基地融合運營商數據與智慧城市等數據,打通了從數據生產到應用的全鏈路。”基地相關負責人表示,目前智慧消防、AI伴游、數字孿生、數字文創(chuàng)等文旅園區(qū)服務能力已在多個文旅平臺實現應用。
從鄉(xiāng)音到AI:一場方言數據的文化解碼行動
當前,AI技術深度融入日常生活。為了讓AI聽懂四川方言,更好地服務廣大群眾,中國電信四川公司采用自研技術,研發(fā)方言發(fā)音詞典,并聯合成都市國家數據標注基地牧山園區(qū),基于已采集的19個地市方言語音大數據,構建四川方言高質量數據集?!岸嗄B(tài)四川方言語言保護”項目,更是入選GSMA全球移動通信系統(tǒng)協會“運營商實踐AI大模型賦能垂直行業(yè)標桿案例集”。
依托方言數據集,中國電信四川公司首創(chuàng)“蒸餾+膨脹”聯合訓練算法,重磅發(fā)布四川方言大模型,全面實現四川方言的識別、合成等功能?!癆I+政務服務熱線”就是基于方言大模型的應用實踐:通過智能填單系統(tǒng)自動解析熱線會話內容,提升客服座席效率;輿情監(jiān)測引擎實時捕捉苗頭性事件,實現輿情的預警、預防;結合工單智能分析技術,自動提煉民生熱點問題并生成可視化報告,助力政府部門精準識別高頻訴求、優(yōu)化公共資源配置。
此外,四川方言大模型還在醫(yī)療、文化旅游、直播助農等領域得到了成功應用。例如,和華西醫(yī)院共同研發(fā)的智慧隨訪系統(tǒng),通過AI賦能,高效解決患者出院后健康監(jiān)測、病情跟蹤及個性化康復指導問題,提升醫(yī)療服務質量與效率。
夯實數字底座,打造數據樞紐與要素服務高地
在人工智能迅速發(fā)展的今天,中國電信四川公司加快算力基礎設施建設和智算布局,在四川形成“2+5+21+X”算力體系,為全省提供云邊端協同、算存運融合的一體化算網調度、一站式智算服務。牧山園區(qū)建設中,公司依托覆蓋全省的“天翼云”資源池,為園區(qū)內AI模型訓練、數據標注等高算力需求場景提供堅實保障。
除算力以外,中國電信四川公司持續(xù)推進“人工智能+”行動,建成AI能力平臺,具備覆蓋大小模型、標訓推測評的全鏈條生產能力,并向各行業(yè)提供自主可控、開源開放、版本豐富的模型服務;落地部署具有數據廣泛可接入、跨域使用可控制、流通動態(tài)可監(jiān)測等能力的可信數據空間平臺,解決數據提供方、使用方、服務方、監(jiān)管方等主體間的安全與信任問題,確保數據在跨領域、跨行業(yè)、多場景下的流通利用全流程可信可控。本次園區(qū)內落地的“可信數據空間新津節(jié)點”就是中國電信四川公司促進數據要素市場健康發(fā)展的一次生動實踐。
當每一份標注數據都在區(qū)塊鏈上獲得數字身份,當每一句鄉(xiāng)音都能喚醒AI的文化共鳴,我們看到的不僅是成都平原崛起的智能高地,更是中國數字經濟破繭成蝶的生動縮影——在這里,數據要素正轉化為新質生產力,標注筆觸終將繪就智能時代的盛世圖景。