支付宝申请训练大模型的方法及装置专利,可确定生成词元的目标奖励分数
创始人
2026-01-01 01:19:56

国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“训练大模型的方法及装置”的专利,公开号CN121234996A,申请日期为2025年9月。

专利摘要显示,本说明书实施例提供一种训练大模型的方法,其中包括:利用目标大模型处理输入序列,得到生成序列,其中包含若干生成词元。将输入序列和生成序列输入奖励模型进行模型处理,使其针对各生成词元,输出截止该生成词元位置处的序列奖励分数。对于各生成词元中任意的第一词元,根据该第一词元位置处的序列奖励分数相对于前序词元位置处的序列奖励分数的增量值,确定该第一词元的目标奖励分数。根据各生成词元对应的各目标奖励分数,利用基于人类反馈的强化学习RLHF算法,调整目标大模型的参数。

天眼查资料显示,支付宝(杭州)数字服务技术有限公司,成立于2016年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,支付宝(杭州)数字服务技术有限公司共对外投资了12家企业,参与招投标项目57次,财产线索方面有商标信息1条,专利信息5000条,此外企业还拥有行政许可60个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

来源:市场资讯

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

奥克兰FC近期豪取三连胜势不可... 澳超联赛迎来了备受瞩目的榜首对决,悉尼FC将在主场迎战目前排名榜首的奥克兰FC。悉尼FC目前以两分之...
阿里云刘伟光:2026年初AI... 【阿里云资深副总裁称2026年初AI应用将再爆发】12月31日消息,阿里云智能集团资深副总裁刘伟光表...
发票也可以“刮奖”啦!50城开... 12月31日,据财政部官网消息, 为充分发挥财政资金引导带动作用,加大直达消费者的普惠政策力度,进一...
福利活动丨2026积分许愿已开... 嘿,小伙伴!2025年的进度条已拉满,你的2026新年愿望清单准备好了吗? 封面新闻2026年元旦特...
凝心聚力暖网格 欢歌笑语迎新年... 阳光讯(记者赵小康通讯员尚钰 文/图)在秦都区马泉街道茂东社区,网格员穿梭街巷排查隐患、调解邻里纠纷...
原创 C... CBA常规赛第九轮比赛,辽宁本钢男篮65-91不敌上海久事男篮,深圳马可波罗男篮101-105输给北...
北京知联会换届大会暨第四届会员... 12月31日,北京党外高级知识分子联谊会换届大会暨第四届会员大会召开。市委常委、统战部部长马骏出席并...
南山区摄影家协会召开第三届第一... 深圳商报·读创客户端记者 曹欣 日前,深圳市南山区摄影家协会第三届第一次会员大会暨第三届理事会第一次...
电影优惠券来了!每天9:00开... 首轮“福影贺岁,惠动八闽” 元旦惠民活动正式上线 5万张“有福电影优惠券” 面向全省观众开放领取 每...
2026年可用的卖家精灵折扣码 最新2026年卖家精灵折扣码如下: 单人包年折扣码:SZYM72 标准以上折扣码:SZYM78 一、...