测评类型第一名第二名第三名模型调用量Claude Opus 4.5Claude Sonnet 4.5MiMo-V2-Flash(free)公司市占率GoogleAnthropicOpenAI编程模型调用量Claude Opus 4.5Grok Code Fast 1Claude Sonnet 4.5各公司按不同能力领域排名汇总
测评类型领先公司大语言模型 Text ArenaGoogle、xAI、Anthropic、百度、OpenAI、智谱、阿里巴巴、月之暗面编程能力 LMArenaAnthropic、OpenAI、Google、智谱、MiniMax编程能力 LiveCodeBenchOpenAI、Anthropic、Google代码工程任务能力 SWE-benchLite基于Claude、Gemini、GPT、Qwen、DeepSeek开发的开源系统图像编辑和生成能力 Image Edit ArenaOpenAI、Google、字节、Black Forest Labs、Reve文生图能力 Text-to-Image ArenaOpenAI、Google、Black Forest Labs、腾讯、字节文生图能力 Text to Image LeaderboardOpenAI、Google、Black Forest Labs、字节、ImagineArtGPQAOpenAI、Google、xAI、Anthropic、阿里巴巴FrontierMathOpenAI、Google、DeepSeek、月之暗面、Anthropic、xAIHumanity's Last ExamGoogle、OpenAI、AnthropicGAIAJoinAI、Nvidia、Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads关注我,第一时间掌握更多AI前沿资讯!