期刊文献+

藏文字符的向量模型及构件特征分析 被引量:6

Vector Space Models and Component Features Analysis of Tibetan Characters
在线阅读 下载PDF
导出
摘要 藏文字属性分析是藏文信息处理的一项基础性工作,对藏文信息处理的研究和藏语文教学具有重要的参考价值及指导意义。藏文字是一种特殊的拼音文字,由1~7个基本构件横向和纵向拼接而成。因而藏文字符的属性包括其组成的构件及其构件的位置特征,以及藏文字的使用频度、结构、字长等属性特征。该文通过分析藏文字的结构,分别建立了藏文字及藏文字符串的向量模型VMTT、VMTS和藏文字符串的稀疏域模型SLM,并在向量模型和稀疏域模型上研究了藏文字符的构件特征。 Tibetan characters property is essential for Tibetan information processing,and it is substantial significance in education and scientific research.Because Tibetan characters writing is directed by both horizontal and vertical 1-7Tibetan characters,the properties of Tibetan characters include the structure,length,frequency of Tibetan characters and the locality features of each characters.This paper establishes vector model(VMTT)of Tibetan characters,vector model(VMTS)and sparse-land model(SLM)of Tibetan character string,and conducts the component feature analysis of Tibetan characters based on these models.
出处 《中文信息学报》 CSCD 北大核心 2016年第2期202-206,共5页 Journal of Chinese Information Processing
基金 国家自然科学基金(61163018,61262051,61363055) 教育部“春晖计划”合作科研项目(Z2012093) 国家社科基金(13BYY141) “长江学者和创新团队发展计划”创新团队资助项目(IRT1068) 青海省科技厅应用基础研究计划基金(2011-Z-755,2011-Z-754) 青海师范大学科研创新计划基金
关键词 中文信息处理 向量模型 稀疏域模型 构件 Chinese information processing vector space model sparse-land model components
  • 相关文献

参考文献17

二级参考文献72

共引文献207

同被引文献100

引证文献6

二级引证文献28

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部