伯克利大学公开盲测 LMSYS 综合排名中,Yi-Large 在中国大模型中排名第一,在中文榜单上 Yi-Large 超过 GPT-4,与 GPT4o 并列排名世界第一(2024.6.25);斯坦福评测机构 AlpacaEval 2.0 经官方认证的模型排行榜上,Yi-Large 的 LC Win Rate 也高于 GPT-4(2024.6.25);在 GPQA、HumanEval、MT-Bench、AlignBench 等权威评测集上,Yi-Large 的得分也高于 GPT-4(2024.5.12)。