国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“一种基于强化学习的模型训练方法及装置”的专利,公开号CN121787501A,申请日期为2025年12月。
专利摘要显示,本说明书实施例提供了基于强化学习的模型训练方法及装置。该方法包括:获取用户指令和设备状态,用户指令用于指示设备执行目标任务,目标任务包括若干个操作步骤,设备状态为设备的当前工作状态;将用户指令和设备状态输入策略模型,由策略模型生成多个输出结果,每个输出结果包括用于执行同一操作步骤的预测动作指令;基于多个输出结果,确定群组成功率,群组成功率用于表示多个输出结果中正确执行操作步骤的输出结果的比率;基于群组成功率,计算得到输出结果对应的奖励信号;基于各个输出结果对应的奖励信号,通过强化学习算法更新策略模型的参数。
天眼查资料显示,支付宝(杭州)数字服务技术有限公司,成立于2016年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,支付宝(杭州)数字服务技术有限公司共对外投资了12家企业,参与招投标项目67次,财产线索方面有商标信息92条,专利信息5000条,此外企业还拥有行政许可60个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
来源:市场资讯