近日,我院胡韧奋老师课题组在国际顶级期刊Studies in Second Language Acquisition(二语习得研究)发表论文“Sense-aware connective-based indices of cohesion and their relationship to cohesion ratings of English language learners’ written production”。论文提出了一系列义项粒度的语篇衔接指标,并基于自然语言处理方法实现了语言特征的自动抽取和指标计算,在此基础上,该研究对大规模英语二语学习者作文数据展开分析,为语篇衔接研究提供了新的视角和测量工具。
该项成果的第一作者为美国宾夕法尼亚州立大学陆小飞教授,通讯作者为我院胡韧奋副教授。Studies in Second Language Acquisition是语言学领域国际顶级期刊,综合影响因子为5.4,属于SSCI一区TOP期刊,谷歌学术显示其h5-index在全部语言学类期刊中排名第一。
论文地址:https://doi.org/10.1017/S0272263124000202
开源数据和工具:https://github.com/iris2hu/sense-aware-cohesion
论文简介
在语篇衔接评估研究中,连词是最为重要的特征之一。然而,很多连词的意义和用法具有多重性,例如“once”既可以承担时间维度的语篇衔接功能(I will leave once I am done),又可作为副词表示“一次性”(The bell will ring once)或“曾经”( I once really liked it),又如连词“since”既有时间衔接功能,又可以在因果衔接中引出原因。现有的语篇衔接测量和评估研究往往未能系统考虑这些意义和用法差别,这为精准、有效地测量文本衔接连贯程度带来了挑战。
针对这一问题,本研究首先利用自然语言处理方法实现了连词意义和用法的自动标注,不仅区分了连词的语篇和非语篇功用,还区分了具体的衔接关系,如转折、因果、扩展和顺承等。进一步地,研究提出了34项义项粒度(sense-aware)的连词衔接测量指标,并基于3911篇二语作文数据展开分析。实验显示,自动标注有较高精度,同时,与传统的连词衔接测量指标相比,本文提出的义项粒度测量指标对作文分数有更强的预测效力。此外,实验结果还有效地回应了前人研究中关于“连词衔接手段与写作质量/语言水平呈现显著负相关”的争议问题,进一步深化了我们对二语写作中连词语篇衔接功能的认识。