复旦大学  
更多 

教师博客

陈振宇、陈振宁,一种基于对齐的时间信息提取方案,《语言研究集刊(第八辑)》,上海辞书出版社,2011年。

发布时间:2021-03-17 点击次数:

提要  怎样将给定的汉语文本中的时间信息提取出来,是当代计算语言学的一个难点。本方案将时间体和事件归为同一类型, 即“时间单位” ,在逻辑上将它们描写为五阶段模型起始前状态、起始、持续状态、终结、终结后状态。每一个阶段都附有对论元之间关系的逻辑描写。从单位的凸显阶段可以抽象出三种时间指针事件指针、参考指针、指示指针。在它们和对齐规则的帮助下,可以推出单位之间的对齐关系。接着运用一些与上下文无关的规则和原则,对结论进行修正, 以便把蕴涵在文本中的信息更为详细地描写出来。在对齐和修正过程的同时, 句中的功能性成分也会实施某种改写操作, 以便更准确地反映说话者的意图。

关键词  时间单位  五阶段模型  对齐  修正  改写