
在人工智能由技術突破邁向規模化應用的關鍵階段,高質量數據已然成為推動產業智能升級的核心要素。
在首都北京,一座超大城市如何鍛造AI核心燃料?
帶著這個疑問,我們走訪中國電信北京公司(以下簡稱“北京電信”),探尋運營商是如何以高質量數據要素賦能千行百業智能化轉型,為數字經濟發展提供至關重要的數據基石。
從“人工”到“智能” 數據標注能力樹起行業金標桿
數據標注被稱為AI訓練的“第一道工序”,通俗來說,就是“教AI認識世界”。比如框選圖片中的貓、標記對話的情緒類別,這些看似簡單的工作,直接關系到AI最終是否“聰明”。
“業內常說,數據質量決定了AI的天花板。”北京電信大數據相關負責人李翔在采訪中表示,“即使模型和算力沒問題,但如果標注環節對業務場景理解不到位,訓練出的AI在實際應用中就容易出錯。”
面對不同行業的多樣化需求,北京電信深入業務一線,將零散的文字、對話和專業知識系統整理成規范的數據集,為機器學習提供高質量“教材”。在此過程中,北京電信形成了一套從理解場景、制定規則、協同標注到質量復核的全流程方法,把模糊的業務需求轉化為清晰的數據標準。
目前,這套成熟的服務體系已在智能問答、行業AI訓練等多個場景落地,為企業提供了可借鑒的AI訓練路徑。
從“散點”到“集群” 三大基地構建數據產能“國家隊”
規模化生產是數據要素產業化的關鍵。早在2025年7月,北京電信深度參與北京市西城區“中國數據街”智能數據標注基地建設,依托自主研發的智能標注引擎,融合自然語言處理、計算機視覺等專利技術,顯著提升標注效率與質量,獲評“圓滿完成國家數據要素綜合實驗區(北京)2025年試驗任務杰出單位”。

同年12月底,北京電信與北京門頭溝區政數局、北京郵電大學等多方力量打造了行業數據智能標注創新中心,聚焦流媒體智能標注、短劇運營、數字人電商、具身智能、交通、氣象數據運營六大方向,構建“算力-數據-模型”閉環全產業鏈。
同期,北京電信與北京石景山聯合建設行業智能數據標注基地,攜手北京郵電大學共建開放式數據服務中樞,聚焦具身智能、產業園區虛擬現實、人工智能聚集區等區域重點方向,全面推動石景山區數智化升級,助力“智慧石景山”建設。
三大基地使數據標注從“小作坊”升級為“現代化工廠”,為產業提供穩定、安全、高效的產能供給。
從“原料”到“產品” 實驗室攻關高質量數據集平臺
基地產出的是“原料”,市場需要的是可直接使用的“成品”。2025年12月,北京電信與北京郵電大學共建的“多模態數據智能感知與治理北京市重點實驗室”入選北京市級重點實驗室名單。
這個實驗室的核心任務,就是把原始、雜亂的數據“原料”,加工成高價值、標準化、可流通的數據“產品”。攻關重點集中在三個環節:讓機器能同時理解文字、圖片、聲音等多種信息,實現真正的多模態協同;把來自不同時間、地點、設備的海量數據進行精準對齊,解決數據“對不上號”的問題;在加工過程中自動識別并加密處理個人隱私等敏感信息,確保數據安全合規。
目前,實驗室正基于這些技術突破加快建設高質量數據集平臺。這個平臺將推動數據從分散的“資源”轉變為標準化的“資產”,讓數據在流通使用中發揮更大價值。
從“產品”到“服務” 雙卓越級認證打通全棧交付
數據集的價值最終體現在應用。在去年7月,北京電信率先通過中國信通院AICloudMSP模型工程化交付能力、高質量云數據集工程服務能力雙項卓越級Lv3+認證,成為運營商最高評級獲得者。

據介紹,該認證覆蓋大模型混合云、公有云托管及私有化部署全場景,整合模型咨詢、數據工程、智算運營等55項指標,實現“數據+算力+算法”一體化交付。企業無需自建產線,即可安全、便捷地調用高水準AI能力,真正讓AI大模型“用得上、用得好、用得安全”。
從“服務”到“生態” 賦能千行百業智能化轉型
北京電信的探索正從單點賦能升級為生態化的“乘法效應”。在“中國數據街”,其智能標注引擎效率提升數倍,成為區域數據產業增長的核心引擎;在京西基地,3D點云、多語種語音等全模態數據服務,已吸引多家領軍企業與科研機構簽約,市場的共同選擇印證了其服務能力。
這些實踐編織出一張賦能智慧城市、工業互聯網、具身機器人等前沿領域的生態網絡,推動AI從技術轉化為現實生產力,為區域數字經濟高質量發展注入澎湃動能。
從實驗室的算法突破,到標注基地的規模化產出,再到云端智算集群的持續運轉,北京電信正將“數據要素x人工智能”的藍圖轉化為扎實的城市數字基座。這條覆蓋全鏈條的數據供給體系,為數字中國建設回答一個重要命題:如何讓高質量數據,像水和電一樣,成為賦能千行百業智能轉型的可靠基石與不竭動力。
(任能旺)