中科院院士何积丰：应对大模型的安全问题，需设好“紧箍咒”

2023-09-08 11:28:00 来源 : 国际金融报

【资料图】

模型的通用能力让其能够应用到人类生产生活的各个场景中，可谓“无孔不入”。AI的发展因此带来了新的安全隐私问题，如何解决这一隐患，9月7日开幕的2023外滩大会上，中国科学院院士何积丰开出了他的“药方”：利用对齐技术为大模型念起“紧箍咒”。

何积丰院士认为，大模型的安全问题主要是在未经同意的情况下，收集、使用和泄露个人信息。隐私问题既可能发生在训练过程，也可能发生在使用过程中，而大模型的生成能力则让“隐私泄露”的方式变得多样化，造成隐私保护更加困难。

“为了应对这些问题，我们需要大模型对齐技术。”何积丰说，“对齐（alignment）”是指系统的目标和人类价值观一致，使其符合设计者的利益和预期，不会产生意外的有害后果。“如果把人工智能看作西游记里的孙悟空，‘对齐’就是唐僧的紧箍咒。有了紧箍咒，就可以保证技术不会任意使用能力胡作非为。”

不过，对齐技术同样面临挑战。首先，对齐的基础，人类的价值观是多元且动态变化的，需要保证大模型为人服务、与人为善；其次，大模型的有用性与无害性之间目标也不完全一致。如何对错误进行有效纠正，设好大模型的“紧箍咒”也是挑战。

因此，对齐技术已经成为了一项令人眼花缭乱的跨学科研究，不仅考验技术，也审视文化。何积丰介绍，反馈强化学习是实现对齐的技术途径，目前有两种方式：一种方式是通过人工反馈给模型不同的奖励信号，引导模型的高质量输出；另一种方式，事先给大模型提供明确的原则，系统自动训练模型对所有生成的输出结果提供初始排序。“这意味着不仅智能系统需要向人类价值观对齐，人类的训练方法也要向价值观对齐。”何积丰说。

标签：

中科院院士何积丰：应对大模型的安全问题，需设好“紧箍咒”
2023-09-08
珠三角部分城市大暴雨引发内涝：广东消防进入24小时临战状态已营救疏散3345人
2023-09-08
程建林在人力社保赛马比拼工作推进会上指出压实责任注重质效交出赛马比拼“高分报表”
2023-09-08
四川成都：新型显示创新成果展开展科技感等十足
2023-09-08
市公共检验检测中心6项省级能力验证均获满意结果
2023-09-08
Rivian CFO：电池材料价格明年将回落
2023-09-08
总投资20亿元！小鹏汽车新车型项目落户肇庆
2023-09-08
“奥本海默”式患者！男子日抽百根烟啤酒当水喝患多种癌症
2023-09-08
创新交能融合全国首座高速公路“零碳隧道”清洁能源工程正式开工
2023-09-08
8月快递业市场规模保持增长日均揽收量保持在3.5亿件左右
2023-09-08
湖北公布第九批生态环境保护执法典型案例
2023-09-08
广西友谊关公路口岸等三大口岸扩大对外开放通过国家验收
2023-09-08
腾讯射击游戏力作《重生边缘》国服今日震撼上线
2023-09-08
5座SUV27万左右哪款好？性价比之选，选车逃不开这几款
2023-09-08
内蒙古自治区市场监督管理局关于516批次食品抽检情况的通告（2023年第11期）
2023-09-08
金宝：9.8镑日震荡不变，日内182.6-183分批买入
2023-09-08
8月出口数据点评：出口的积极因素正在小幅累积
2023-09-08
市场悲观情绪升温，股指或在被动中走反弹
2023-09-08
西宁文旅消费强劲复苏
2023-09-08
老人三轮车滑入池塘警民合力救援
2023-09-08
暑期档电影创新高新导演成中坚力量
2023-09-08
瑞丰银行(601528.SH)：董事长章伟东辞职
2023-09-08
朱鹮有了“新身份”！义务当起有机产品的“环境质检员” | 高质量发展调研行·陕西站
2023-09-08
2024年投产：路特斯推出全新电动跑车Emeya
2023-09-08
美国防部前官员：向乌克兰提供贫铀弹是白宫绝望之际的错误决定
2023-09-08
限时免费看电影！《扬名立万》一场高端局剧本杀
2023-09-08
2517.39万元惠及职工8万余人！九江今年首批稳岗资金发放到位
2023-09-08
“一虾两园，嗨游淮安”夏夜消费节圆满收官
2023-09-08
蓝箭电子9月8日盘中涨幅达5%
2023-09-08
漫评｜共襄亚运盛会，科技国潮尽显“中式浪漫”
2023-09-08
北京公积金贷款仍执行“认房认贷”政策，哪些信息值得关注？
2023-09-08
海关总署：8月份中国铜进口量环比增长4.9%
2023-09-08
珠三角部分城市突发大暴雨广东消防全力迎战
2023-09-08
土壤水分监测
2023-09-08
机器人大PK！首届智能机器人创新创业邀请赛决出胜负
2023-09-08
新西河水库今日9时泄洪
2023-09-08
巴西南部暴雨遇难人数升至40人
2023-09-08
玩家太想用PS玩《星空》！不惜自制星空主题PS5主机
2023-09-08
下一场TGA游戏开发者日展示将于12月举行
2023-09-08
立邦创新推出多款汽车涂料防火产品
2023-09-08
利空依旧存在短期PP价格或依附成本端
2023-09-08
俄罗斯炼厂季节性维护 9月原油出口量料增加
2023-09-08
湖南榫卯木门首次出口
2023-09-08
我国建成全球规模最大的电力供应系统和清洁发电体系
2023-09-08
保镖开路、横行于道，明星前呼后拥给谁看？
2023-09-08
三都水族端节系列活动将于9月29日举办
2023-09-08
杭州第19届亚运会火炬“薪火”传递启动
2023-09-08
沈阳落实认房不认贷对购房者有那些利好？
2023-09-08
石狮市领导带队开展教师节慰问活动
2023-09-08
晋江天气：本轮降水基本结束未来三天以多云天气为主
2023-09-08
晋江：仓库被盗多次未被发现警方5小时抓获惯犯
2023-09-08
男子接连盗窃“神像” 不到半年再次进宫
2023-09-08
泉州鲤城：启动第二批老旧小区改造涉及52个小区
2023-09-08
伪装秘密人物的游戏-伪装游戏密码
2023-09-08
永城市举办落实食品安全“两个责任”工作专班业务培训会
2023-09-08
《进击的汉字》帮美女翻墙通关攻略
2023-09-08
《博德之门3》第三章装备玛科赫什基获取攻略
2023-09-08
中央气象台：预计未来3天广东广西强降雨
2023-09-08
官方：有更宏大的叙事《真人快打1》只是开端
2023-09-08
南京四区买房不再需要购房证明
2023-09-08