清华大学黄昌宁教授做客文学院第62期语言学论坛

日期:2015-05-22 16:30:34  浏览量:281

                                            

黄昌宁教授认真细心的讲座

520日下午,清华大学黄昌宁教授在我院216教室做客62期语言学论坛,带来主题为词意识和汉语信息处理漫谈的讲座。

论坛开始前文学院彭泽润教授先向大家介绍了黄昌宁教授。他说,计算语言学是应用语言学中一门重要的学科,黄教授长期从事人工智能和计算语言学的教学和科研工作,主要研究自动分词、词性标注、句法语义分析和机器翻译,是中国计算机语言学领域的专家。

黄教授以语言学与计算机学科的关系切入,提出了可学性——比较词类标注体系的一种定量指标观点,并且从3个方面讲解:一是对词性标注语料库进行了简单介绍,二是对评测的基本概念以及可学性的定义进行了阐述,三是对CTBNCCCKU进行了比较。最后得出结论,基于词例的词类标注体系CTB的可学性高于基于词典的词类标注体系PKUNCC。也就是说,基于词例的词类标注体系优于基于词典的词类标注体系。黄教授表示,语言学是一个资源丰富的金矿。语言学与计算机有着千丝万缕的联系,可以进行跨学科的交流,而且这种跨学科的应用研究更有价值。他以机器翻译为例,讲述运用大数据方式进行双语翻译,解释了计算机表现出的人工智能行为。他指出,用语言学知识能够帮助计算机进行语言处理,同时语言学家也可以借助计算机进行语言研究,比如语料库语言学。

接着,论坛进入了互动阶段。同学们就词的切分存在歧义以及对汉语存在的兼类词等问题进行了提问,黄教授耐心回答了学生们的疑问。

彭泽润教授在总结中说,黄教授给我们提供了计算语言学方向新的信息和研究成果。计算语言学让我们看到,传统词典脱离了动态的语言环境,难以给计算机提供高度准确的词类信息,必须重视词在实际话语中的功能。

文学院第62期语言学论坛在黄教授和彭教授的指导和同学们积极的参与中圆满结束。