国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“用于强化学习的方法、装置、存储介质及电子设备”的专利,公开号CN121707012A,申请日期为2025年11月。
专利摘要显示,本说明书实施例公开了一种用于强化学习的方法、装置、存储介质及电子设备,首先使得目标模型针对目标问题进行第一强化学习的多次第一轨迹采样,获得所述目标模型关于所述目标问题的第一成功率;若所述第一成功率小于或等于第一预设阈值,根据所述目标问题在专家轨迹库中检索对应的正确解题步骤,其中,所述正确解题步骤包括有序的多个语义片段;确定所述正确解题步骤对应的锚点,其中,所述锚点包括位于所述多个语义片段中前面的至少一个语义片段;使得所述目标模型从所述锚点开始继续完成针对所述目标问题的第二强化学习。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
来源:市场资讯