第 7 季 · 2025 春季评测进行中

让 AI 模型,在同一张画布上 即兴创作

VibeBench 是一个评测前端编程能力的开放基准平台。同一道题,不同模型各自生成单文件 HTML 作品,我们并排呈现——你来看谁更懂审美、懂结构、懂风格。

142
挑战题目
28
参赛模型
3,874
提交作品
96.2%
人工复核率
赛题列表
从基础组件到视觉实验,涵盖真实前端工程的多个层面。
全部 · 142
UI 组件
数据可视化
创意动画
布局挑战
交互游戏
实用工具
VB-078 中等
有机形态个人主页
打造一个体现"自然生长"美学的个人作品集页面,避免锐利直角,拥抱流动曲线。
VB-091 困难
纯 CSS 粒子引力场
不使用 JS 或 Canvas,仅用 CSS 变量与动画模拟粒子在重力中的聚散效果。
VB-103 入门
气象仪表盘
设计一个可视化当日天气的仪表盘,包含温度曲线、湿度环、风向罗盘三个核心模块。
VB-115 中等
像素艺术绘板
可交互的 32×32 像素网格画板,支持撤销重做、调色板切换与 PNG 导出。
VB-127 困难
3D 卡片翻转画廊
使用 CSS 3D Transform 构建可横向滚动的立体卡片画廊,鼠标悬停产生视差效果。
VB-134 入门
番茄钟专注计时器
25+5 的番茄工作法计时器,包含舒缓的视觉呼吸反馈与完成度统计。
参赛模型
覆盖主流旗舰模型,每季更新一次总分与雷达数据。
C
Claude Sonnet 4.5
Anthropic · 2025.03
92.4/ 100
审美
95
结构
90
创意
92
G
GPT-5 Turbo
OpenAI · 2025.02
89.7/ 100
审美
88
结构
94
创意
87
G
Gemini 2.5 Pro
Google · 2025.03
87.1/ 100
审美
84
结构
89
创意
88
L
Llama 4 Opus
Meta · 2025.01
83.5/ 100
审美
80
结构
86
创意
84
作品并排对比
四个模型针对同一赛题的实时作品预览,一目了然。
赛题 · VB-078
"有机形态个人主页"
C
Claude Sonnet 4.5
94.2
A Portfolio by Ava
G
GPT-5 Turbo
88.7
G
Gemini 2.5 Pro
86.3
L
Llama 4 Opus
81.9
综合排行榜
本季所有赛题的综合得分加权均值,每 24 小时更新。
#
模型
总分
表现
本季
01
C
Claude Sonnet 4.5
92.4
↑ 3.2
02
G
GPT-5 Turbo
89.7
↑ 1.8
03
G
Gemini 2.5 Pro
87.1
↑ 4.5
04
L
Llama 4 Opus
83.5
↑ 2.1
05
D
DeepSeek V3.5
81.2
↑ 6.7
06
Q
Qwen 3 Max
78.9
↓ 0.4
07
M
Mistral Large 3
75.3
↑ 1.1