国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“训练大模型的方法及装置”的专利,公开号CN121234996A,申请日期为2025年9月。
专利摘要显示,本说明书实施例提供一种训练大模型的方法,其中包括:利用目标大模型处理输入序列,得到生成序列,其中包含若干生成词元。将输入序列和生成序列输入奖励模型进行模型处理,使其针对各生成词元,输出截止该生成词元位置处的序列奖励分数。对于各生成词元中任意的第一词元,根据该第一词元位置处的序列奖励分数相对于前序词元位置处的序列奖励分数的增量值,确定该第一词元的目标奖励分数。根据各生成词元对应的各目标奖励分数,利用基于人类反馈的强化学习RLHF算法,调整目标大模型的参数。
天眼查资料显示,支付宝(杭州)数字服务技术有限公司,成立于2016年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,支付宝(杭州)数字服务技术有限公司共对外投资了12家企业,参与招投标项目57次,财产线索方面有商标信息1条,专利信息5000条,此外企业还拥有行政许可60个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
来源:市场资讯