2024年7月10日,东南大学自动化学院李世华教授邀请阿联酋穆罕穆德本扎耶德人工智能大学耿佳辉博士作了主题为“深度学习和大语言模型中的隐私与安全”的学术报告
深度学习和大语言模型(LLMs)在自然语言处理、图像识别、医疗诊断等领域取得了显著的进展。然而,这些技术的快速发展也带来了隐私和安全方面的挑战。在大规模数据集上训练的模型可能包含敏感信息,导致隐私泄露风险。语言模型可能出现胡言乱语,回答不清楚的问题, 影响人们的决策。此外,模型的复杂性使其易受各种攻击,包括越狱攻击,诱导模型绕过安全对齐,回答危险的问题,比如如何制造毒品、如何编程木马病毒。本次报告主要介绍了深度学习和大语言模型中的隐私与安全等方面的研究进展。
图 1 报告现场
报告人简介
图 2 耿佳辉博士
耿佳辉,现在阿联酋穆罕穆德本扎耶德人工智能大学(MBZUAI)担任博士后研究员,与Iryna Gurevych和Preslav Nakov教授合作。主要的研究领域是大语言模型系统的可信性与安全性。东南大学11级自动化学院本科生,2018年10月在德国亚琛工业大学取得计算机科学硕士学位,师从Hermann Ney教授研究课题是无监督机器翻译。2023年6月在挪威斯塔万格大学取得计算机科学博士学位,师从Chunming Rong和 Martin Gilje Jaatun教授,欧盟玛丽居里CLARIFY项目研究员,主要研究内容是隐私保护的机器学习,包括联邦学习、数据集蒸馏等。目前在 IJCAI, NAACL, EMNLP、ECML-PKDD、EASE、IJCNN、IEEE Transactions on Big Data 等会议期刊都有发表记录,担任Journal of Machine Learning Research, ACL ARR, IEEE Transactions on Big Data等会议期刊审稿人。2018-2020年在上海携程担任负责翻译系统高级工程师。