近來,“詞元”(Token)在互聯網上頻頻“出圈”,對“詞元經濟”的討論熱度也持續(xù)不減。日前發(fā)布的《全國數據資源調查報告(2025年)》顯示,2025年全國年度數據生產總量達52.26澤字節(jié)(ZB),全球占比超27%;詞元調用量約21100萬億,呈指數級增長。
所謂詞元,是人工智能大模型處理信息的基本單元。它可以是單個漢字、標點符號,或一個詞語片段。我們每次向人工智能大模型提問,以及大模型生成的文字、圖片或視頻等,都離不開詞元的調用和運算。而詞元經濟,則是指在人工智能領域,圍繞詞元的生產、調用、分發(fā)與結算所衍生形成的新型經濟形態(tài)。
可以說,詞元正成為人工智能產業(yè)發(fā)展的“晴雨表”。詞元調用量的不斷攀升,充分彰顯了我國人工智能產業(yè)欣欣向榮的發(fā)展態(tài)勢?!梆B(yǎng)龍蝦”全網爆火,讓人們切身感受到人工智能不僅會“聊天”,還能“干活”;DeepSeek-V4預覽版本正式上線并同步開源,關鍵性能指標達到國內外領先水平;豆包大模型披露付費計劃,嘗試在免費版的基礎上,推出包含更多增值服務的付費版本,打開國產大模型“價值變現”的商業(yè)化想象空間……
當前,我國詞元經濟發(fā)展方興未艾,但也面臨諸多挑戰(zhàn)。比如,在高端制造、金融投資等對精度和可靠性要求嚴苛的專業(yè)領域,從詞元數據質量到模型推理過程,國產人工智能大模型的表現還“欠些火候”;“數據孤島”現象依然存在,公共數據開發(fā)利用處于起步階段,高質量數據集短缺,數據要素流通仍需“拆墻鋪路”;利用人工智能大模型生成虛假信息、侵犯版權及肖像權等亂象層出不窮,亟須監(jiān)管為其“套上韁繩”;人工智能大模型的商業(yè)模式尚在探索,清晰且可持續(xù)的“生意經”仍待市場驗證。
充分激發(fā)詞元經濟活力,關鍵在于找準制約詞元價值釋放的瓶頸所在,精準發(fā)力、協(xié)同推進,構建起良好的詞元經濟生態(tài)。例如,突破核心算法等方面的技術短板,助力國產大模型在更多實際應用場景中“落地生根”;打破“數據孤島”,讓數據要素更高效地“跑起來”;健全人工智能和數據安全領域的政策法規(guī),為詞元的生成、流轉及交易劃好“紅線”;打通大模型商業(yè)價值閉環(huán),培育“模型即服務”“智能體即服務”等新業(yè)態(tài),實現技術創(chuàng)新與商業(yè)模式創(chuàng)新“雙向奔赴”。
推動詞元經濟健康發(fā)展,不應止步于詞元規(guī)模的快速增長,更應著眼于發(fā)展質效的全面提升。唯有系統(tǒng)破解詞元經濟發(fā)展面臨的堵點,充分釋放數據要素的價值潛力,方能夯實我國人工智能產業(yè)高質量發(fā)展的根基。
(責任編輯:蔡文斌)