支付宝申请模型强化学习方法专利,优化目标函数以实现对目标模型的参数的更新
创始人
2026-01-23 14:08:25

国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“模型强化学习方法、装置和设备”的专利,公开号CN121365703A,申请日期为2025年10月。

专利摘要显示,本说明书实施例提供一种模型强化学习方法、装置和设备。方案包括:在采样阶段使用推理引擎采用待训练的目标模型在第一策略参数下针对输入序列生成输出序列并记录输出序列中各词元的第一概率值,并计算各词元的优势值,在训练阶段当使用训练引擎前向传播获得目标模型在第一策略参数下生成的各词元的第二概率值后,可以计算各词元的第二概率值与第一概率值的第一比率,进而筛选出第一比率处于预设数值范围内的词元参与目标函数的计算,进而优化目标函数以实现对目标模型的参数的更新。

天眼查资料显示,支付宝(杭州)数字服务技术有限公司,成立于2016年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,支付宝(杭州)数字服务技术有限公司共对外投资了12家企业,参与招投标项目60次,财产线索方面有商标信息76条,专利信息5000条,此外企业还拥有行政许可60个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

来源:市场资讯

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

关于鹏华国证半导体芯片交易型开... 为促进鹏华国证半导体芯片交易型开放式指数证券投资基金(以下简称“半导体ETF”)的市场流动性和平稳运...
普利特1月13日获融资买入1.... 来源:新浪证券-红岸工作室 1月13日,普利特跌10.00%,成交额13.78亿元。两融数据显示,当...
移动大流量卡,到底是省心利器还... 办卡:微 信 公 众 号 搜【 可可 找卡】,每天更新运营商官方高性价比套餐!帮你精准匹配适配流量方...
金融为民,农行新华支行开展便民... 为深入践行“金融为民、服务暖心”的初心使命,扎实推进普惠金融服务向基层延伸,近日,农行阳江新华支行走...
中央商场涨2.20%,成交额2... 来源:新浪证券-红岸工作室 1月7日,中央商场盘中上涨2.20%,截至10:27,报4.19元/股,...