中国科学院自动化研究所(CASIA)与日本国际电气通信基础技术研究所(ATR)和韩国电子通信研究院(ETRI)关于语言信息技术合作的国际研讨会于6月3日在自动化所成功举行。
中国科学院自动化研究所与日本国际电气通信基础技术研究所和韩国电子通信研究院的三方合作又称CJK(China-Japan-Korea)合作,其合作协议正式签署于2004年4月,主要目标是面向现代通信技术和信息社会重大需求,尤其是面向2008年北京奥运会多语言口语自动翻译和通信问题,进行语音、语言技术的联合攻关。在此框架下,三方进行中、日、韩三种语言的口语语料共同开发与共享、语音识别与合成以及汉英自动翻译技术模块的相互交换等实质性合作。由于中、日、韩合作三方同属国际语音翻译先进研究联盟(Consortium for Speech Translation Advanced Research international, C-STAR)的核心成员,又是亚洲相邻的国家,有着共同的研究兴趣和目标,而且有多年友好的合作历史。因此,自CJK合作协议签订以来,三方合作非常顺利,到目前为止已完成25万句汉、日、韩三种语言口语句子级对照语料的共同开发工作,这是自2003年C-STAR完成16万句BTEC多语言(汉、英、日、德、意、韩6种语言)口语对照语料以来又一次国际性更大规模的多语言口语平行语料资源共同开发和共享行动。至此,中科院自动化所仅在国际合作框架下就已拥有了汉、日、韩三种语言各40多万句的大规模多语言口语对照语料使用权。这也是目前为止国际上规模最大、对照语言种类最多的口语平行语料。在本次CJK研讨会上,合作三方还相互交换了汉语语音识别模块、汉语语音合成模块、汉英自动翻译模块以及日、韩对应技术模块的动态链接库。另外,此次研讨会三方还就下一步新的合作目标和计划进行了富有成效的磋商。
随着全球化信息时代的到来,国际合作已经成为一种必然,尤其要解决多语言自动翻译和跨语言通信问题,没有多国科学家的联合攻关和携手合作是不可想象的。我们相信,CJK合作实现的语料资源和技术模块共享必将为语音自动翻译技术的深入研究奠定很好的基础。 |