时间:2023年10月10日14:00-16:00
地点:腾讯会议 483-851-424
时间 | 主讲人 | 主题 |
14:00-14:30 | 吴婷婷 | 真实噪声场景下的文本鲁棒学习研究 |
14:30-15:00 | 高靖龙 | 大模型时代下的因果推理技术研究 |
15:00-15:30 | 熊凯 | 知识增强的无偏事件推理技术研究 |
15:30-16:00 | 王昊淳 | 大语言模型在医学场景上的应用 |
题目:真实噪声场景下的文本鲁棒学习研究
主讲人:吴婷婷 哈工大金沙js9线路中心博士研究生
时间:14:00-14:30
研究方向:机器学习、带标签噪声的学习、自然语言处理应用
内容简介:深度神经网络(DNNs)在各种任务中都取得了巨大的成功。但作为一种数据驱动的方法,它的成功很大程度上归功于大规模的人工标注数据集。由于获取大量高质量的数据标注非常耗费人力且并不可行,许多研究人员经常采用另一种廉价但并不完美的方法来替代,如基于模板的抽取方法、自动标注方法等。这些方法不可 避免地会涉及到有噪声的样例(即带有噪声标签的样例),而DNNs又容易对有噪声的标签过拟合, 导致泛化性能较差。本次讲解主要对如何在真实噪声场景下,构建一种鲁棒的学习方法进行相关的技术讲解。
主讲人简介:吴婷婷,哈尔滨工业大学社会计算与信息检索研究中心博士生,导师刘挺教授,副导师丁效教授,在TMM、ACL、EMNLP等期刊及会议发表多篇论文。
题目:大模型时代下的因果推理技术研究
主讲人:高靖龙 哈工大金沙js9线路中心博士研究生
时间:14:30-15:00
研究方向:自然语言处理,因果推理
内容简介:因果推理能力是众多自然语言处理应用的基石,也是评估人工智能发展水平的重要标志。以往的因果推理模型主要依赖BERT等小型预训练语言模型。这些工作注重模型结构的设计及数据增强等技术的应用。然而近期ChatGPT等大模型崭露头角,带来了自然语言处理领域研究范式的转变。本次讲解将对大模型时代下因果推理相关的前沿进展进行介绍。
主讲人简介:高靖龙,哈尔滨工业大学社会计算与信息检索研究中心博士生,导师刘挺教授。
题目:知识增强的无偏事件推理技术研究
主讲人:熊凯 哈工大金沙js9线路中心博士研究生
时间:15:00-15:30
研究方向:事件推理、事理图谱
内容简介:事件是指发生在某个特定时间点或时间段、某个特定地域范围内,由一个或者多个角色参与的一个或者多个动作组成的事情或者状态的改变。事件是人类社会的核心概念之一,人类的社会活动往往是由事件驱动的。各类知识对于理解事件及事件关系起到至关重要的作用。例如“商品价格上涨”可能会导致“通货膨胀”,基于此类事件知识,我们可以进行金融风险预警。本次讲解主要讲解预训练语言模型和大语言模型场景下的事件推理,利用各类知识来无偏地理解事件及事件间关系,并执行无偏地事件推理。
主讲人简介:熊凯,哈尔滨工业大学社会计算与信息检索研究中心博士生,导师刘挺教授。在EMNLP会议上发表过论文。
题目:大语言模型在医学场景上的应用
主讲人:王昊淳 哈工大金沙js9线路中心博士研究生
时间:15:30-16:00
研究方向:医学预训练语言模型、提示学习
内容简介:大语言模型在大语言模型在医学等垂直领域的效果仍有限,为缓解上述问题,我们提出了本草-一种基于医学知识增强的大型语言模型指令微调方法,一种让通用大模型适配行业并改造成行业大模型的方法。首先通过结合垂直领域知识库、医学专业文献,自动构建高质量大语言模型指令微调数据集,而后将大语言模型在上述数据集上进行指令微调,实现在医学领域问答上更好的性能表现。
主讲人简介:王昊淳,哈尔滨工业大学社会计算与信息检索研究中心博士生,导师刘挺教授。在ACL、COLING等会议上发表过论文。