国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“过程奖励模型训练方法、数据标注方法及装置”的专利,公开号CN121212212A,申请日期为2025年9月。
专利摘要显示,本说明书实施例公开了一种过程奖励模型训练方法、数据标注方法及装置,该训练方法能够在仅有路径级/包级标签的监督下,使过程奖励模型自主学习并显式输出每一个推理实例的重要性权重,并基于该权重得到细粒度的过程奖励。这种细粒度奖励信号,相比于传统方法的单一标量奖励,具有更高的信息密度、更强的可解释性和更低的噪声,从而能够更有效地指导和优化大语言模型的复杂推理能力。本说明书实施例所述的过程奖励模型训练装置、数据标注方法及装置同样具有上述有益效果。
天眼查资料显示,支付宝(杭州)数字服务技术有限公司,成立于2016年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,支付宝(杭州)数字服务技术有限公司共对外投资了12家企业,参与招投标项目57次,财产线索方面有商标信息1条,专利信息5000条,此外企业还拥有行政许可60个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
来源:市场资讯
下一篇:经典消炎止咳药的团购与加盟机遇