欢迎小主! 162导航

#ai安全#

  • 爱可可-爱生活 31天前 北京

    【奖励黑客行为:强化学习中的一个现象,指的是AI通过利用奖励函数的缺陷或不明确性来获得高分,而不是真正学习和完成既定任务。本文探讨了这一现象的背景、定义、存在原因以及在现实世界中的例子,并讨论了如何缓解这一问题。】’Reward Hacking in Reinforcement Learning - Lil'Log' ...全文

  • 戴斌 245天前 广州

    美国成立了AI安全顾问委员会,我们要未雨绸缪,汇聚资源打造中国版的AI护城河。#AI安全# #财经# #中美科技战# 戴斌的🎞︎微博视频

  • 爱可可-爱生活 7天前 北京

    【AI越狱攻防:聚焦多模态生成模型的安全漏洞研究,提供越狱攻击与防御策略的全面概览,旨在提升AI模型的安全性和鲁棒性】'A Survey on Jailbreak Attacks and Defenses against Multimodal Generative Models' GitHub: github.com/liuxuannan/Awesome-Multimodal-Jailbreak #AI安全# #多模态# ...全文

  • 张美波_风间子 45天前 成都

    突然发现 AI Safety 这个术语其实有点难以直接翻译。AI Safety 可以直译为“AI安全”,不过AI Security 也可以直译为“AI安全”,但是这两个“AI安全”之间存在本质的区别。 AI Safety 更多是业务层面,围绕着 AI 的内容、伦理、合规之类,核心保障措施就是微软的 Responsible AI 实践。而 AI Securit ...全文

  • 以色列在中国 186天前 

    🚗【智能守护,安全驾驶】以色列CorrActions公司带来创新AI平台,以车辆内置传感器为眼,无需摄像头即可"读心",实时监测驾驶员状态。🧠🔍 这项技术通过分析驾驶员的微小动作,不仅能洞察他们是否疲劳、分心或醉酒,还尊重了乘客的隐私,不依赖任何视觉监控。智能评分系统实时评估驾驶员的认知 ...全文

  • 遂昌快活林 309天前 丽水

    #AI安全# AI深度伪造欺诈激增30倍AI安全产业链公司受关注 $奇安信(sh688561)$、$启明星辰(sz002439)$ 据媒体报道,近日,奇安信集团发布《2024人工智能安全报告》称,人工智能技术的恶意使用将快速增长,在政治安全、网络安全、物理安全和军事安全等方面构成严重威胁。报告数据显示,2023年基于AI的深 ...全文

  • 遂昌快活林 484天前 丽水

    #ai安全# 【中国电信、蚂蚁、华为、百度、字节跳动等30余机构共同发起AI安全工作组】 9月7日下午,在2023 inclusion·外滩大会举行的《探索下一代安全智能》论坛上,世界权威国际产业组织“云安全联盟”(CSA)大中华区宣布成立“AI安全工作组”,中国电信、蚂蚁集团、华为、百度、字节跳动、西安电子 ...全文

  • 鹅厂程序员 1445天前 

    #鹅厂技术干货# #ai安全# #机器学习# 【“免疫杀手” Deep X-RAY】 近日,腾讯朱雀实验室发现了一种全新的攻击技术,能够借助机器学习,以黑盒方式探测出WAF后端规则,从而实现完美规避。对于企业来说,这无疑是个“免疫杀手”。新技术的出现,必然会带来新的影响。唯有不断探索安全的边界,提前发 ...全文

  • c

    coolc-有趣的灵魂 1746天前 

    达沃斯2020关于#AI安全# 的话题。Yuval Noah:“如果你有足够的数据,一个国家甚至不需要士兵”。AI是写进国家发展纲要的#新动能# ,银行、贸易、交通、民生这么多线上应用都和AI有交集,这上面出了篓子或段位不够,真的会被对手打得“生活不能自理”,大家准备好迎战了吗? coolc-世界和平的🎞︎微博视频

  • 天津汇柏科技有限公司 4天前 天津

    发布了头条文章:《AI安全的挑战:如何让人工智能变得更加可信》 #人工智能# #ai安全# AI安全的挑战:如何让人工智能变得更加可信

  • 世界人工智能大会 16天前 上海

    7月4日,在#2024世界人工智能大会# 产业发展主论坛上,#星环科技# 创始人、CEO孙元浩参与“AI发展·人本之道”主题跨界交流,和多位嘉宾共同探讨了如何构建以人为本、负责任的产业生态共同体。他认为,人工智能应成为人类发展的助手,而非替代者,通过完善的安全测试、标准,确保其在安全和道德的框架内服 ...全文

  • 张美波_风间子 19天前 成都

    人之初、性本善,在“社会”这座学校里接收的坏知识多了,自然就容易学坏了。AI也一样… #ai创造营# #ai安全# #人工智能#

  • 安安全全客客 25天前 北京

    软件公司 Palantir Technologies 与武器制造商 Anduril Industries 正在深化合作,以加速AI在美国军事领域的应用,并邀请其他公司加入这一技术推进计划。通过这项合作,双方计划通过先进的数据收集技术,将战场信息汇聚到 Palantir 的 AI 平台中,为军事决策和技术发展提供支撑。 ...全文

  • 时间视频 75天前 北京

    AI让生活更便捷,但安全不可忽视!关注这些细节,让智能生活更安心。#人工智能# #AI安全# #朝阳群众守护您#

  • A

    ArtisTechbyJULIAN 120天前 昆明

    AI **💡 OpenAI 联合创始人 Ilya Sutskever 的新计划:10 亿美元融资推动超级智能 AI 安全!🚀** 🎉 **重大消息!** 人工智能领域的传奇人物、OpenAI 联合创始人 **Ilya Sutskever** 最近推出了一家新企业——**Safe Superintelligence**,并成功从 **a16z(Andreessen Horowitz)* ...全文

  • V

    VergeThe 126天前 重庆

    **#OpenAI与Anthropic将与美国政府共享AI模型,共促安全发展# ** 🔍 科技界重大举措!OpenAI与Anthropic宣布与美国AI安全研究所达成协议,允许美国政府在新AI模型发布前获取使用权,以评估并提升模型安全性。这一合作旨在提前识别和缓解潜在风险。 🔒 官方消息,这些公司将与美政府在大模型发布前 ...全文

  • 江江也叫Glowin 170天前 北京

    来自 UC Berkeley 的 Sizhe Chen 提出了一种名为 StruQ 的系统,通过使用结构化查询来防御提示注入攻击(Prompt Injections)。StruQ 将提示和用户数据分离,通过前端编码和特殊训练的 LLM 来提高安全性。实验结果显示,StruQ 在抵御多种提示注入攻击方面表现出色,同时对模型的实用性影响甚微。#AI安全# ...全文

丨话题榜