爱可可-爱生活 31天前 北京
【奖励黑客行为:强化学习中的一个现象,指的是AI通过利用奖励函数的缺陷或不明确性来获得高分,而不是真正学习和完成既定任务。本文探讨了这一现象的背景、定义、存在原因以及在现实世界中的例子,并讨论了如何缓解这一问题。】’Reward Hacking in Reinforcement Learning - Lil'Log' ...全文
爱可可-爱生活 31天前 北京
【奖励黑客行为:强化学习中的一个现象,指的是AI通过利用奖励函数的缺陷或不明确性来获得高分,而不是真正学习和完成既定任务。本文探讨了这一现象的背景、定义、存在原因以及在现实世界中的例子,并讨论了如何缓解这一问题。】’Reward Hacking in Reinforcement Learning - Lil'Log' ...全文
张美波_风间子 45天前 成都
突然发现 AI Safety 这个术语其实有点难以直接翻译。AI Safety 可以直译为“AI安全”,不过AI Security 也可以直译为“AI安全”,但是这两个“AI安全”之间存在本质的区别。 AI Safety 更多是业务层面,围绕着 AI 的内容、伦理、合规之类,核心保障措施就是微软的 Responsible AI 实践。而 AI Securit ...全文
以色列在中国 186天前
🚗【智能守护,安全驾驶】以色列CorrActions公司带来创新AI平台,以车辆内置传感器为眼,无需摄像头即可"读心",实时监测驾驶员状态。🧠🔍 这项技术通过分析驾驶员的微小动作,不仅能洞察他们是否疲劳、分心或醉酒,还尊重了乘客的隐私,不依赖任何视觉监控。智能评分系统实时评估驾驶员的认知 ...全文
世界人工智能大会 16天前 上海
7月4日,在#2024世界人工智能大会# 产业发展主论坛上,#星环科技# 创始人、CEO孙元浩参与“AI发展·人本之道”主题跨界交流,和多位嘉宾共同探讨了如何构建以人为本、负责任的产业生态共同体。他认为,人工智能应成为人类发展的助手,而非替代者,通过完善的安全测试、标准,确保其在安全和道德的框架内服 ...全文
安安全全客客 25天前 北京
软件公司 Palantir Technologies 与武器制造商 Anduril Industries 正在深化合作,以加速AI在美国军事领域的应用,并邀请其他公司加入这一技术推进计划。通过这项合作,双方计划通过先进的数据收集技术,将战场信息汇聚到 Palantir 的 AI 平台中,为军事决策和技术发展提供支撑。 ...全文
ArtisTechbyJULIAN 120天前 昆明
AI **💡 OpenAI 联合创始人 Ilya Sutskever 的新计划:10 亿美元融资推动超级智能 AI 安全!🚀** 🎉 **重大消息!** 人工智能领域的传奇人物、OpenAI 联合创始人 **Ilya Sutskever** 最近推出了一家新企业——**Safe Superintelligence**,并成功从 **a16z(Andreessen Horowitz)* ...全文
VergeThe 126天前 重庆
**#OpenAI与Anthropic将与美国政府共享AI模型,共促安全发展# ** 🔍 科技界重大举措!OpenAI与Anthropic宣布与美国AI安全研究所达成协议,允许美国政府在新AI模型发布前获取使用权,以评估并提升模型安全性。这一合作旨在提前识别和缓解潜在风险。 🔒 官方消息,这些公司将与美政府在大模型发布前 ...全文