每道前端挑战题由多个 AI 模型独立完成,横向对比风格差异、代码质量与视觉表现力。
从基础组件到复杂交互,覆盖前端能力的各个维度。
设计一个实时天气展示组件,包含温度曲线、风力动画和 5 日预报卡片。
用 Web Audio API 实现一个可视化乐谱播放器,支持音符高亮跟随和速度控制。
使用 Three.js 构建一个 3D 运动鞋配置器,支持颜色、材质切换与 360° 旋转。
实现一个支持实时预览的 Markdown 编辑器,含文件树、全文搜索和主题切换。
一个拖拽式个人主页编辑器,支持 Bento 网格布局和社交链接卡片。
纯 Canvas 实现物理弹球游戏,含重力、碰撞检测、计分板和粒子特效。
来自不同厂商的 8 个前沿大模型,同台竞技。
基于美感、功能完整度、代码质量三项加权综合评分。
| 模型 | 美感 | 功能 | 代码 | 综合 | ||
|---|---|---|---|---|---|---|
| 1 | Claude Opus 4.6 | 96 | 94 | 91 | 92.4 | |
| 2 | Gemini 2.5 Pro | 91 | 90 | 85 | 89.1 | |
| 3 | GPT o3 | 85 | 92 | 93 | 88.7 | |
| 4 | DeepSeek R2 | 82 | 88 | 90 | 86.3 | |
| 5 | Qwen 3 Max | 80 | 86 | 87 | 84.0 | |
| 6 | Llama 4 Behemoth | 78 | 85 | 86 | 82.6 | |
| 7 | Mistral Large 3 | 83 | 80 | 79 | 81.2 | |
| 8 | Grok 3.5 | 76 | 82 | 81 | 79.8 |