#ai安全#

爱

爱可可-爱生活　31天前　北京

【奖励黑客行为：强化学习中的一个现象，指的是AI通过利用奖励函数的缺陷或不明确性来获得高分，而不是真正学习和完成既定任务。本文探讨了这一现象的背景、定义、存在原因以及在现实世界中的例子，并讨论了如何缓解这一问题。】’Reward Hacking in Reinforcement Learning - Lil'Log' ...全文
戴

戴斌　245天前　广州

美国成立了AI安全顾问委员会，我们要未雨绸缪，汇聚资源打造中国版的AI护城河。#AI安全# #财经# #中美科技战# 戴斌的🎞︎微博视频
爱

爱可可-爱生活　7天前　北京

【AI越狱攻防：聚焦多模态生成模型的安全漏洞研究，提供越狱攻击与防御策略的全面概览，旨在提升AI模型的安全性和鲁棒性】'A Survey on Jailbreak Attacks and Defenses against Multimodal Generative Models' GitHub: github.com/liuxuannan/Awesome-Multimodal-Jailbreak #AI安全# #多模态# ...全文
张

张美波_风间子　45天前　成都

突然发现 AI Safety 这个术语其实有点难以直接翻译。AI Safety 可以直译为“AI安全”，不过AI Security 也可以直译为“AI安全”，但是这两个“AI安全”之间存在本质的区别。 AI Safety 更多是业务层面，围绕着 AI 的内容、伦理、合规之类，核心保障措施就是微软的 Responsible AI 实践。而 AI Securit ...全文
以

以色列在中国　186天前　

🚗【智能守护，安全驾驶】以色列CorrActions公司带来创新AI平台，以车辆内置传感器为眼，无需摄像头即可"读心"，实时监测驾驶员状态。🧠🔍 这项技术通过分析驾驶员的微小动作，不仅能洞察他们是否疲劳、分心或醉酒，还尊重了乘客的隐私，不依赖任何视觉监控。智能评分系统实时评估驾驶员的认知 ...全文
遂

遂昌快活林　309天前　丽水

#AI安全# AI深度伪造欺诈激增30倍AI安全产业链公司受关注 $奇安信(sh688561)$、$启明星辰(sz002439)$ 据媒体报道，近日，奇安信集团发布《2024人工智能安全报告》称，人工智能技术的恶意使用将快速增长，在政治安全、网络安全、物理安全和军事安全等方面构成严重威胁。报告数据显示，2023年基于AI的深 ...全文
遂

遂昌快活林　484天前　丽水

#ai安全# 【中国电信、蚂蚁、华为、百度、字节跳动等30余机构共同发起AI安全工作组】 9月7日下午，在2023 inclusion·外滩大会举行的《探索下一代安全智能》论坛上，世界权威国际产业组织“云安全联盟”（CSA）大中华区宣布成立“AI安全工作组”，中国电信、蚂蚁集团、华为、百度、字节跳动、西安电子 ...全文
鹅

鹅厂程序员　1445天前　

#鹅厂技术干货# #ai安全# #机器学习# 【“免疫杀手” Deep X-RAY】近日，腾讯朱雀实验室发现了一种全新的攻击技术，能够借助机器学习，以黑盒方式探测出WAF后端规则，从而实现完美规避。对于企业来说，这无疑是个“免疫杀手”。新技术的出现，必然会带来新的影响。唯有不断探索安全的边界，提前发 ...全文
c

coolc-有趣的灵魂　1746天前　

达沃斯2020关于#AI安全# 的话题。Yuval Noah：“如果你有足够的数据，一个国家甚至不需要士兵”。AI是写进国家发展纲要的#新动能# ，银行、贸易、交通、民生这么多线上应用都和AI有交集，这上面出了篓子或段位不够，真的会被对手打得“生活不能自理”，大家准备好迎战了吗？ coolc-世界和平的🎞︎微博视频
天

天津汇柏科技有限公司　4天前　天津

发布了头条文章：《AI安全的挑战：如何让人工智能变得更加可信》 #人工智能# #ai安全# AI安全的挑战：如何让人工智能变得更加可信
世

世界人工智能大会　16天前　上海

7月4日，在#2024世界人工智能大会# 产业发展主论坛上，#星环科技# 创始人、CEO孙元浩参与“AI发展·人本之道”主题跨界交流，和多位嘉宾共同探讨了如何构建以人为本、负责任的产业生态共同体。他认为，人工智能应成为人类发展的助手，而非替代者，通过完善的安全测试、标准，确保其在安全和道德的框架内服 ...全文
张

张美波_风间子　19天前　成都

人之初、性本善，在“社会”这座学校里接收的坏知识多了，自然就容易学坏了。AI也一样… #ai创造营# #ai安全# #人工智能#
安

安安全全客客　25天前　北京

软件公司 Palantir Technologies 与武器制造商 Anduril Industries 正在深化合作，以加速AI在美国军事领域的应用，并邀请其他公司加入这一技术推进计划。通过这项合作，双方计划通过先进的数据收集技术，将战场信息汇聚到 Palantir 的 AI 平台中，为军事决策和技术发展提供支撑。 ...全文
时

时间视频　75天前　北京

AI让生活更便捷，但安全不可忽视！关注这些细节，让智能生活更安心。#人工智能# #AI安全# #朝阳群众守护您#
A

ArtisTechbyJULIAN　120天前　昆明

AI **💡 OpenAI 联合创始人 Ilya Sutskever 的新计划：10 亿美元融资推动超级智能 AI 安全！🚀** 🎉 **重大消息！** 人工智能领域的传奇人物、OpenAI 联合创始人 **Ilya Sutskever** 最近推出了一家新企业——**Safe Superintelligence**，并成功从 **a16z（Andreessen Horowitz）* ...全文
V

VergeThe　126天前　重庆

**#OpenAI与Anthropic将与美国政府共享AI模型，共促安全发展# ** 🔍 科技界重大举措！OpenAI与Anthropic宣布与美国AI安全研究所达成协议，允许美国政府在新AI模型发布前获取使用权，以评估并提升模型安全性。这一合作旨在提前识别和缓解潜在风险。 🔒 官方消息，这些公司将与美政府在大模型发布前 ...全文
田

田丰说　143天前　北京

#人工智能# #大模型# #OpenAI# #科技# #AI# #AI安全# #硅谷# 田丰说的🎞︎微博视频
江

江江也叫Glowin　170天前　北京

来自 UC Berkeley 的 Sizhe Chen 提出了一种名为 StruQ 的系统，通过使用结构化查询来防御提示注入攻击(Prompt Injections)。StruQ 将提示和用户数据分离，通过前端编码和特殊训练的 LLM 来提高安全性。实验结果显示，StruQ 在抵御多种提示注入攻击方面表现出色，同时对模型的实用性影响甚微。#AI安全# ...全文

更多内容请移步微博原话题 >>

162

#ai安全#

丨话题榜