首页 >> 语言学 >> 语言学术动态
《圣经》助力计算机语言学发展
2015年09月11日 14:28 来源:中国社会科学报 作者:侯丽/编译 字号

内容摘要:机器翻译系统在进行词汇解释或翻译时,往往只能输入英语、法语等使用人数多的语言,对一些生僻的小语种常常无能为力。目前,科研人员正试图通过《圣经》破解这一难题。

关键词:机器翻译;计算语言学;圣经;小语种;语法结构

作者简介:

  中国社会科学报综合外媒报道 机器翻译系统(machine translation systems)在进行词汇解释或翻译时,往往只能输入英语、法语等使用人数多的语言,对一些生僻的小语种常常无能为力。目前,科研人员正试图通过《圣经》破解这一难题。 

  丹麦哥本哈根大学的研究人员正在研究如何通过分析《圣经》中的语法结构等,帮助机器翻译系统对小语种进行开发。计算机语言学中一个重要内容是基于搜索引擎的机器翻译系统,英语、法语、汉语等使用人数多的语言在进行交互翻译或词义自行解释时,人们可以直接对手机讲话,通过手机搜索引擎获得初步的机器翻译结果,因为英语等语言使用人数多,互联网存储信息众多,相关计算机语言技术开发得也较完善。然而,如果你使用的是小语种,如法罗语(Faroese)、威尔士语(Welsh)或加利亚西语(Galician),可能就无法轻松地从搜索引擎中获得更多资源。 

  机器翻译系统的开发基于大量的数据,包括手动添加的注释文本,是一个搜索资源逐渐丰富的过程。以英语为例,基于一些历史原因,对英语词汇的解释和翻译,多出于长期以来英文报刊上积累的文章和素材,但人们很难从历史报刊数据中找到更多的小语种数据,即使有使用人数较多的语言,如超过280万人使用的非洲语言约鲁巴语(Yoruba),该语种词汇的相关注释也难以被搜索到。 

  在哥本哈根大学“低谷”(LOW-LANDS)研究项目中,语言学家希望通过分析一些互联网“低资源语言”(Low-Resource Languages)的语系和语言的语法结构,来获得一些小语种词汇在相应的“大语种”中的注释,进而丰富搜索引擎的资源。其中的关键便是找到一种合适的、具有参考价值的翻译文本。《圣经》迄今为止已经被翻译成1500种语言,包括使用人数较少的小语种,经过历史的变迁和考验,《圣经》在各种小语种中的语法结构相当考究,比如其中的一些律诗,翻译得“保守”而规范,结构严谨,适合成为机器翻译时的一种文本参考模型。 

  研究人员表示,分析《圣经》中的小语种语法和表达方式并将其引入计算机语言中,可以帮助人们找到并开发一种相对精确的计算机模型,弥补机器翻译在小语种翻译方面的不足,促进计算机语言学的发展和完善。 

分享到: 0 转载请注明来源:中国社会科学网 (责编:王婷婷 实习)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们