同一个 Prompt 并发打到多个大模型,实时对比 首Token时延 · 思考TPS · 输出TPS · 峰值速度。给 AI 测评博主的竞速仪器,截图即发文。
↑ 演示动画 · 真实数据来自你接入的模型
在线版部署在 Vercel(海外边缘节点)。大陆网络跨境连接偶发不稳, 可能出现「Failed to fetch / network error」——这是你的浏览器到本站服务器这一跳的波动, 与 DeepSeek、Kimi 等模型厂商无关,多数情况点「重跑」即可恢复。
想要最稳的体验?项目完全开源,Fork 到自己电脑本地运行—— 浏览器和代理都在本机,直连各厂商,没有跨境这一跳,又快又稳:
git clone https://github.com/twonly/Model-Arena.git
cd Model-Arena && npm install
npm run dev # 打开 http://localhost:3000本地运行功能完全一致,且本地版默认可直连 Ollama 等本机模型。