语言应用研究 和不透明词均可以以0.9左右为界(不透明词标有下划线)。 自动评估结果与我们的直觉以及人工评价有一致性 (我们也参照文献[3]做了一组人工评估,见附录表1,其 结果与自动评估数据做了相关分析,得出相关系数值为 0.674)。说明了我们的假设有一定的可行性。当然,我们 仅对一组复合词进行了试验,要真正利用这个方法进行批 量的语义透明度评价,还要进一步检验和改进。另外,我 们得到的语义透明度的数据之间的差异不是很大,与之相 对,人工评估数据一般取0—10,设5为透明与不透明的分界 值。能否改进公式的计算方法或改进模型的训练参数,把透 明度的值调整到更合理的区间范围内,值得进一步探索。 同时,我们可以看出,实验中语义透明度评价是以某一 个语素或者词作为参考,它是一个相对值,如果不考虑这一 点,透明度将无法定义。而如果语素是有多义的,则某个词 语的透明度值不是唯一的,例如“花费”相对“花.”的透明 度低,相对于“花 ”的透明度高。以某个语素或词的某具 体义项作为参照,是语义透明度评价的前提,我们在人工 评价语义透明度的时候是否考虑到这些因素?仅仅以熟悉 的语素某个义项作为参照是有缺陷的。 如果把词语问的语义距离看成两点距离或者绝对距 离,语义透明度则是以某些点为参照的相对距离,词语透 明与不透明的分界点恰好是这种相对距离上的某个阂值。 七、结语 实验在现有理论模型基础上对一组词语做了一系列语 义分析和计算。提取语义后,语义聚类网图和语义距离很 好地展示了词语间的同义多义和异义关系,相对语义距离 展示了语义透明度自动评估的可行性。这些语言知识,是 通过语料无指导学习得到。从本质上讲,这些语义知识, 融合了词汇语法,还有语用语义。而且随着语料的变大和 合理的实验设计,这种值越趋向合理。语义透明度一向是 心理学和语言习得界研究的一个很重要的概念,词 的语 附录: 义透明度让语言学习者见词知义、学习和记忆词汇有据可 依。语义透明度自动评测的探讨有望带来一定的理论价值 和实际意义。 表1:人工评估语义透明度值 (本文受教育部人文社会科学重点研究基地重大项目 “留学生汉语词汇习得的计算机模拟研究[NO.08JJD740063]’’ 资助。) 兵(陈永朝 北京中国传媒大学文学院 1 00024;邢红 北京语言大学汉语水平考试中心1 00083) 语 式 WEN 文字网发布了作品,数以十计的相关网站与语言文字网建 立了友情链接,被各大搜索引擎收录且排名靠前。李开拓 先生这样评价: “网站的内容很丰富,且通过网站还可由 此及彼,资讯广通;焦点、热点汇集,各种观点齐备:立 学术之前沿,引研究之方向。相信,经过不断完善和大力 1]差日 i三£ 二+ 语言文字网是一个专门针对语言文字、中文信息处理等 资源进行整合的网站,面向个人、社团、刊物、会议等开办 专辑专栏,为广泛的语言文字爱好者搭建一个交流平台。 语言丈字网坚持不带任何偏见、让每一个人充分发表 意见的办刊宗旨,提供了一个公开、公平、公正的平台, 得到了广泛的认可和支持。来自世界各地的专家学者在语 言文字网设立了永久性专栏,数以百计的专家学者在语言 推广,定能大有作为。” 语言文字网负责向《汉字书同文研究 丛书、 ((中 文》季刊以及中文学术期刊 北华大学学报 、《现代语 文》等合作伙伴推荐文稿。网络与期刊互动:论题互通, 稿件互换,宣传互利,电子文本与纸质文本互补。 为帮助更多的同好实现网上安家的梦想,语言文字网 欢迎更多的朋友以各种方式参与网站的建设。 网址:httD://www.yywzw.com 201O.03