Copyright 2005-2025 王晨云 版權所有 京ICP備20051637號-1
8月29日,由清華大學計算機系崔鵬教授團隊聯合穩準智能共同研發的結構化數據通用大模型“極數”(LimiX)正式宣布開源。此次發布標志著我國在結構化數據智能應用領域的技術突破與生態開放邁出了關鍵一步,將顯著降低千行百業的AI技術門檻。特別是在結構化數據占主導的泛工業領域,“極數”大模型將助力AI深度融入工業生產全流程,破解工業數據價值挖掘難題,為實現智能制造與新型工業化提供關鍵支撐,推動產業技術變革和優化升級。
泛工業領域渴求準確高效的結構化數據智能應用技術
在泛工業領域,結構化數據的智能處理能力直接影響產業效率與科研突破。因語言大模型(LLM)和私有數據+專用模型兩種傳統的結構化數據處理范式長期存在準確率低、難泛化、不通用,成本高等一系列缺陷,嚴重制約了AI在工業場景的落地路徑。
“極數”大模型通過學習數據因果關系,實現了可在不同上下文信息中捕捉因果變量,數據分布的能力,以適應分類、回歸、缺失值預測、數據生成、因果推斷等任務。在產業應用層面,“極數”大模型已成功落地多個真實工業場景,單一模型適配多場景、多任務的通用性突破獲得合作企業的高度認可,形成了面向泛工業垂直行業核心業務場景的真正智能底座。
“極數”模型在多領域任務中獲得性能突破
“極數”模型的研發核心團隊由國家杰出青年科學基金獲得者、國家自然科學二等獎得主、國際計算機協會(ACM)杰出科學家、清華大學計算機系崔鵬教授牽頭組建,團隊兼具學術研究深度與產業落地能力。
“極數”模型在評測方面,選取了各個領域的權威數據集作為Benchmark。如開源數據集Talent,它包含上百個真實數據集,是當前領域內體量最大、最具代表性的基準之一。在分類任務中,對比“極數”與24個領域內的最優模型,“極數”大模型的模型性能顯著超越其他模型,在AUC、ACC、F1Score和ECE上均取得了最優。
在回歸任務上,“極數”大模型在R2和RMSE指標上都達到了平均最優,對比其他最優模型展現出了明顯的優勢。并且在數據集中有干擾特征或無效特征時,性能優勢更加明顯。