麻省理工科技评论 157天前 北京
【南洋理工团队打造任务数据集和测试基准,提高网页智能体的任务完成能力】 近日,通过使用#GPT-4v# 、#Gemini-pro# 等大模型,#南洋理工大学# 实习生张子牛和所在团队发现,目前网页智能体的能力还非常欠缺,尤其是在完成多个子任务混合的任务时。 为了提高智能体在网页上的操作能力,该课题组打造 ...全文
麻省理工科技评论 157天前 北京
【南洋理工团队打造任务数据集和测试基准,提高网页智能体的任务完成能力】 近日,通过使用#GPT-4v# 、#Gemini-pro# 等大模型,#南洋理工大学# 实习生张子牛和所在团队发现,目前网页智能体的能力还非常欠缺,尤其是在完成多个子任务混合的任务时。 为了提高智能体在网页上的操作能力,该课题组打造 ...全文