学生必看
员工必看
返回主站
English
邮箱 校园网络 VPN 办事大厅 校园卡 CUHK(SZ) 账号 软件服务 教务 在线视频服务
学生必看
员工必看
返回主站
English
  • 关于我们
    • 部门介绍
    • 服务台
    • 规章制度
      • 政策法规
      • 管理规定
    • 多媒体设施与数据中心
  • 我们的服务
    • 办事大厅
    • 校园网络
    • 桌面及终端应用
    • 账号及权限
  • 网络和信息安全
    • 安全规定
    • 重要数据的保护
    • 钓鱼邮件警示
    • 安全提示
    • 密码安全
    • 安全技能
  • 高性能计算
    • 平台介绍
    • 平台资源
      • 硬件资源
      • 软件资源
    • 使用指南
      • 各集群使用规范
      • 其他规范及办法
      • 操作手册
      • 培训视频
    • 收费标准
      • 机时费收费标准
      • 存储空间使用费收费标准
    • 案例介绍
  • 应用软件
  • 常见问题
    • 多媒体设备
    • 校园卡
    • 校园网
    • 云打印
    • 问卷平台
    • 软件相关
    当前位置:
  • 首页
  • 高性能计算
  • 案例介绍
  • 吴保元教授团队提出基于多模态大型语言模型的视觉-语言不一致性数据清理器: VDC-张洪宝提供(2024年)
高性能计算
平台介绍
平台资源
  • 硬件资源
  • 软件资源
使用指南
  • 各集群使用规范
  • 其他规范及办法
  • 操作手册
  • 培训视频
收费标准
  • 机时费收费标准
  • 存储空间使用费收费标准
案例介绍
吴保元教授团队提出基于多模态大型语言模型的视觉-语言不一致性数据清理器: VDC-张洪宝提供(2024年)

       这篇论文作为会议论文发表在ICLR 2024,第一作者是香港中文大学(深圳)数据科学学院博士生朱梓豪,指导老师为香港中文大学(深圳)数据科学学院的吴保元教授。吴教授团队的研究重点是人工智能安全与隐私、机器学习、计算机视觉与优化。

       论文:Versatile Data Cleanser based on visual-linguistic inconsistency by multi-modal large language models

       论文地址:https://arxiv.org/pdf/2309.16211

       开源代码:https://github.com/zihao-ai/vdc

       数据在构建人工智能系统中的作用,随着数据中心人工智能概念的兴起而被强调。然而,在现实世界中,数据集可能包含脏样本,例如后门攻击中的中毒样本、众包中的噪声标签,甚至两者的混合体。这些脏样本的存在使得深度神经网络易受攻击且不可靠。因此,检测脏样本以提高数据集的质量和可靠性是至关重要的。现有的检测方法通常仅专注于检测中毒样本或噪声标签,但在处理来自其他领域的脏样本时常常表现出较弱的泛化能力。

       在本文中,我们发现各种脏样本的共同点在于图像与其关联标签之间的视觉-语言不一致性。为了捕捉跨模态的不一致语义,我们提出了多功能数据清洗器(VDC),该方法利用了多模态大语言模型在跨模态对齐和推理方面的卓越能力。VDC由三个连续模块组成:视觉问题生成模块,生成有关图像的有见地的问题;视觉问答模块,通过MLLM回答这些问题以获取视觉内容的语义;最后是视觉答案评估模块,用于评估不一致性。

       大量实验表明,VDC在处理各种类别和类型的脏样本时,具有卓越的性能和泛化能力,具体表现为高TPR,低FPR,且利用筛选过后的数据重新训练模型,在测试集上表现出了较好的性能。

 

 

版权所有 © 香港中文大学(深圳)资讯科技服务处