Copyright 2005-2025 王晨云 版權所有 京ICP備20051637號-1
隨著人工智能在代碼以及圖片生成方面日益成熟,越來越多的研究人員也開始關注 AI 模型在游戲領域中的表現。實際上,游戲在 AI 的發展早期就已經是一個重要的研究方向,許多前期研究聚焦在 Atari,星際爭霸,Dota 等熱門游戲,并成功訓練出了表現超越人類玩家的專用模型。然而,這類模型通常只能在單一游戲環境中運行,缺乏跨游戲的泛化能力。
另一方面,雖然 ChatGPT 和 Gemini 這類模型通用模型在眾多任務上已經展現出了卓越的能力,它們卻難以在游戲環境中取得好的表現,即便是很簡單的射擊游戲。
為了解決這一問題,來自 Player2 的研究員們提出了Pixel2Play(P2P)模型,該模型以游戲畫面和文本指令作為輸入,直接輸出對應的鍵盤與鼠標操作信號。在消費級顯卡 RTX 5090 上,P2P 可以實現超過 20Hz 的端到端推理速度,從而能夠真正像人類一樣和游戲進行實時交互。P2P 作為通用游戲基座模型,在超過40款游戲、總計8300 +小時的游戲數據上進行了訓練,并能夠以零樣本(zero-shot)的方式直接玩 Roblox 和 Steam 平臺上的多款游戲。
為了促進領域的發展,Open-P2P 團隊在沒有使用許可限制的情況下開源了全部的訓練與推理代碼,并公開了所有的訓練數據集。