摘要
藏文字属性分析是藏文信息处理的一项基础性工作,对藏文信息处理的研究和藏语文教学具有重要的参考价值及指导意义。藏文字是一种特殊的拼音文字,由1~7个基本构件横向和纵向拼接而成。因而藏文字符的属性包括其组成的构件及其构件的位置特征,以及藏文字的使用频度、结构、字长等属性特征。该文通过分析藏文字的结构,分别建立了藏文字及藏文字符串的向量模型VMTT、VMTS和藏文字符串的稀疏域模型SLM,并在向量模型和稀疏域模型上研究了藏文字符的构件特征。
Tibetan characters property is essential for Tibetan information processing,and it is substantial significance in education and scientific research.Because Tibetan characters writing is directed by both horizontal and vertical 1-7Tibetan characters,the properties of Tibetan characters include the structure,length,frequency of Tibetan characters and the locality features of each characters.This paper establishes vector model(VMTT)of Tibetan characters,vector model(VMTS)and sparse-land model(SLM)of Tibetan character string,and conducts the component feature analysis of Tibetan characters based on these models.
出处
《中文信息学报》
CSCD
北大核心
2016年第2期202-206,共5页
Journal of Chinese Information Processing
基金
国家自然科学基金(61163018,61262051,61363055)
教育部“春晖计划”合作科研项目(Z2012093)
国家社科基金(13BYY141)
“长江学者和创新团队发展计划”创新团队资助项目(IRT1068)
青海省科技厅应用基础研究计划基金(2011-Z-755,2011-Z-754)
青海师范大学科研创新计划基金
关键词
中文信息处理
向量模型
稀疏域模型
构件
Chinese information processing
vector space model
sparse-land model
components