支付宝申请针对大语言模型的强化学习方法专利,提升模型收敛速度
创始人
2026-06-26 07:36:58

国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“针对大语言模型的强化学习方法和装置”的专利,公开号CN122264020A,申请日期为2026年4月。

专利摘要显示,本说明书实施例提供一种针对大语言模型的强化学习方法和装置。方法包括:获取具备思维链生成能力的基座大语言模型;针对目标查询语句,驱动基座大语言模型生成多个候选回复,每个候选回复均包含思维链内容和答案;针对每个候选回复,将其中的思维链内容与人工知识库中预设的规则集进行匹配,从而确定该思维链内容与规则集的符合度作为第一奖励值;确定该候选回复中答案对应的第二奖励值;根据第一奖励值和第二奖励值确定该候选回复的综合奖励值;根据多个候选回复分别对应的综合奖励值,对基座大语言模型的参数进行更新。能够对模型的思考过程进行约束,提升模型收敛速度。

天眼查资料显示,支付宝(杭州)数字服务技术有限公司,成立于2016年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,支付宝(杭州)数字服务技术有限公司共对外投资了11家企业,参与招投标项目69次,财产线索方面有商标信息92条,专利信息9818条,此外企业还拥有行政许可60个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

来源:市场资讯

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

原创 考... 最近,钟丽缇女儿考拉的隐私照风波再度冲上热搜,引发舆论狂潮。事情起源于三月份,考拉在社交平台上发布了...
原创 瞒... 谁还记得前段时间在娱乐圈闹得沸沸扬扬的钟丽缇女儿偷拍风波?当时大多数人都信了钟丽缇的说法,觉得这不过...
原创 新... 北京时间6月27日11:00,世界杯G组第三轮较量将在新西兰与比利时之间展开。两支球队在此前的两轮小...
原创 火... 北京时间6月27日,2026美加墨世界杯G组小组赛第三轮展开较量,世界排名第九的比利时对阵新西兰。整...
世界杯丨小组赛:比利时队战胜新... 当地时间6月26日,在加拿大温哥华进行的2026美加墨世界杯足球赛G组小组赛中,比利时队5比1战胜新...
组图:比利时5-1新西兰头名出... 2026美加墨世界杯小组赛G组,新西兰 1-5 比利时。比利时球员阿马杜・奥纳纳与队友赛后庆祝,比利...
比利时5比1新西兰,小组第一出... 北京时间6月27日,2026年美加墨世界杯G组第三轮,比利时队迎战新西兰,最终比利时5比1战胜对手,...
乐的美光电取得LED灯带散热结... 国家知识产权局信息显示,江门市乐的美光电有限公司取得一项名为“一种LED灯带用散热结构及LED灯带”...
腾飞普天取得降噪音暗装轨道龙骨... 国家知识产权局信息显示,湖南腾飞普天声学建材科技有限公司取得一项名为“一种降噪音的暗装轨道龙骨集成结...
全面解析防水材料的种类与应用:... 防水材料在现代建筑中扮演着核心角色,确保建筑物的安全与舒适。根据其用途,防水材料可以分为多种类型,其...