霸榜WMT机器翻译大赛最难赛道阿里国际AI翻译模型Marco
WMT的人工评测被视为机器翻译领域的◁=■“黄金标准▷☆▷△○”▼-…•○…,Marco-MT超越了Gemini 2☆◇■◁.5 Pro▽★○▲□、GPT-4▼★▪=.1◁•▲△、Claude 4和Mistral-Medium等所有顶尖闭源AI系统○■…,在最受关注的英中语向上▲…,
登顶榜首▽△●。这也标志着Marco-MT从电商行业翻译迈向通用翻译的领先行列▲▪▲□。其中●◇□◆。
WMT被誉为机器翻译领域的▷▷▽●-“黄金标准◁▲▽□”▲-…★,其评测结果被全球学术界与工业界视为技术风向标●■◆…。本届赛事采用COMET◆…◁▽、LLM Judge等自动指标与大规模人工评测相结合的机制▼▽◁=☆-,最终排名以人工评分为准=•。Marco-MT在包括英译中在内的13个核心语向表现优异◁==★,跻身全球顶尖水平☆▲,标志着其通用翻译能力获得广泛认可…▼★◆■。其中■…▷,在英译中等多个语向上▷○◆•▲◁,表现超过人工翻译▷•★▼■●。
Marco-MT此次脱颖而出△◁-◇,关键在于将丰富的电商翻译模型训练经验与一套原创训练方法M2PO(多阶段偏好优化)相结合○◇◇□◁,成功将强化学习范式应用于大模型翻译领域●□▼○☆厂商Hitcard获红杉注资PP电子泡泡玛特投资的卡牌,。该系统分三步提升翻译质量◁=☆▪★:先通过两轮监督微调拓宽知识基础▷=□■◁;再引入强化学习…●□▷◁,让模型学会判断译文优劣△○□▪▽▼;最后在解码阶段融合词对齐与重排序技术○▲••◁△,在保证流畅的同时精准还原原文▪▲△◇○▲,显著提升翻译的准确性和忠实度■□▪●。
据「TMT星球」了解•◇◆▷▷,Marco-MT发布于2024年☆•◆◇=▲,最初专注于电商场景翻译■■◁,已接入阿里国际旗下的电商平台…□□▽,支持搜索◆◁•、商品信息◆•▪-●、对话☆=•▷■霸榜WMT机器翻译大赛最难赛道、图片等多种场景的翻译▽▪▽。跨文化●▼-•…、多语种的业务需求▪▲◆,使其具备高质量▪▼▲☆△、低幻觉率等核心优势△◆■■◁,为此次向通用翻译的拓展打下坚实基础●-▽◁★▷。此前▪△□▼,Marco-MT已在语音翻译领域崭露头角▽…•●,在2025年IWSLT国际赛事中斩获2项冠军和2项亚军▪…,表现出机器翻译领域多模态的竞争力◇▽-。
阿里国际的Marco-MT模型参加的是WMT竞赛中难度更高的受限赛道○△△。相比于非受限赛道-…◁▼,受限赛道不仅要求模型能够处理文学▷•、新闻◁▷▷◆▪◆、社交媒体等多样化内容••▪▽◇,还需严格遵守仅使用开源数据和开源模型=△□,且模型规模不超过20B的限制条件★▪…▷◆阿里国际AI翻译模型Marco。





