支付宝申请基于强化学习训练生成模型专利,减缓奖励破解的问题
创始人
2026-02-27 22:47:44

国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“基于强化学习训练生成模型的方法及装置”的专利,公开号CN121581138A,申请日期为2025年11月。

专利摘要显示,本说明书实施例提供一种训练生成模型的方法及装置,针对目标生成模型,可以在GRPO强化学习的基础上,引入竞争性对抗学习的另外一个生成模型,对于同一条输入数据,可以由两个生成模型分别进行处理,各自得到多条生成信息,然后,可以将两个生成模型对应的生成信息一一对应,并通过判别模型对比确定各条生成信息的奖励分数。然后根据奖励分数确定目标生成模型的优化目标,向着优化目标最大化方向调整目标生成模型的待定参数。在目标生成模型优化的同时,还可以对作为竞争的另一个生成模型进行优化。如此,构成竞争性对抗强化学习,可以减缓奖励破解的问题。

天眼查资料显示,支付宝(杭州)数字服务技术有限公司,成立于2016年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,支付宝(杭州)数字服务技术有限公司共对外投资了12家企业,参与招投标项目65次,财产线索方面有商标信息76条,专利信息5000条,此外企业还拥有行政许可60个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

来源:市场资讯

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

一年前刚升正厅,牛顺生任上被查 中央纪委国家监委网站2月28日讯 据湖南省纪委监委消息:湖南省怀化市政协党组书记、主席牛顺生涉嫌严重...
以色列国防军:以色列全境拉响警... 本文转自【新华社】; 新华社快讯:以色列国防军说,以色列全境拉响警报,并直接向手机设备发送了预警指示...
约30个伊朗境内目标遭到袭击!... 当地时间2月28日,总台记者获悉,截至目前共有大约30个伊朗境内目标遭到袭击,其中包括伊朗总统府和伊...
原创 俄... 中东的火药桶已经被推到了引爆边缘,美国在完成对委内瑞拉的强势动作之后,全部战略重心都压向了伊朗,白宫...
2026年昆士兰大学研究生留学... 2026年昆士兰大学研究生留学申请指南,助你高效准备与申请 昆士兰大学(The Universit...
2026年昆士兰大学硕士留学申... 2026年昆士兰大学硕士留学申请流程全面解析,高效准备指南 昆士兰大学(The Universit...
(全国两会)全国人大代表乔进双... 中新网乐山2月28日电 题:全国人大代表乔进双梅:指尖绣文脉 履职守彝乡 作者 王利文 “彝绣不是束...
小米SU7成都碰撞事故新出鉴定... 成都天府大道此前发生的小米SU7 Ultra交通事故,持续引发关注。 近日,成都小米汽车碰撞燃烧事故...
甘肃临洮抢夺方向盘致出租车撞树... 极目新闻记者 舒隆焕 2月7日晚,甘肃定西临洮县一男乘客因抢夺出租车方向盘,引发出租车撞树事故,致其...
电影《飞驰人生3》发布“视野打... 搜狐娱乐讯 电影《飞驰人生3》今日发布“视野打开”正片片段。 张驰(沈腾 饰)在高速行驶中赛车引擎...