国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“模型强化学习方法、装置和设备”的专利,公开号CN121365703A,申请日期为2025年10月。
专利摘要显示,本说明书实施例提供一种模型强化学习方法、装置和设备。方案包括:在采样阶段使用推理引擎采用待训练的目标模型在第一策略参数下针对输入序列生成输出序列并记录输出序列中各词元的第一概率值,并计算各词元的优势值,在训练阶段当使用训练引擎前向传播获得目标模型在第一策略参数下生成的各词元的第二概率值后,可以计算各词元的第二概率值与第一概率值的第一比率,进而筛选出第一比率处于预设数值范围内的词元参与目标函数的计算,进而优化目标函数以实现对目标模型的参数的更新。
天眼查资料显示,支付宝(杭州)数字服务技术有限公司,成立于2016年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,支付宝(杭州)数字服务技术有限公司共对外投资了12家企业,参与招投标项目60次,财产线索方面有商标信息76条,专利信息5000条,此外企业还拥有行政许可60个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
来源:市场资讯
上一篇:今视角|赛博皮卡亮相济南商场