Test Run #1 Analysis

Comparing model performance for the TECHNOLOGIES Benchmark benchmark.

Global Filters

Languages

Models

Tags

Overall Avg. Score

0.522

Best Model

Gemini 2.5 Pro

Highest Model Score

0.535

Model Scores per Language