藏文字符的向量模型及构件特征分析被引量：6

Vector Space Models and Component Features Analysis of Tibetan Characters

在线阅读下载PDF

导出

摘要藏文字属性分析是藏文信息处理的一项基础性工作,对藏文信息处理的研究和藏语文教学具有重要的参考价值及指导意义。藏文字是一种特殊的拼音文字,由1～7个基本构件横向和纵向拼接而成。因而藏文字符的属性包括其组成的构件及其构件的位置特征,以及藏文字的使用频度、结构、字长等属性特征。该文通过分析藏文字的结构,分别建立了藏文字及藏文字符串的向量模型VMTT、VMTS和藏文字符串的稀疏域模型SLM,并在向量模型和稀疏域模型上研究了藏文字符的构件特征。 Tibetan characters property is essential for Tibetan information processing,and it is substantial significance in education and scientific research.Because Tibetan characters writing is directed by both horizontal and vertical 1-7Tibetan characters,the properties of Tibetan characters include the structure,length,frequency of Tibetan characters and the locality features of each characters.This paper establishes vector model（VMTT）of Tibetan characters,vector model（VMTS）and sparse-land model（SLM）of Tibetan character string,and conducts the component feature analysis of Tibetan characters based on these models.

作者才智杰才让卓玛

机构地区青海师范大学陕西师范大学计算机科学学院

出处《中文信息学报》 CSCD 北大核心 2016年第2期202-206,共5页 Journal of Chinese Information Processing

基金国家自然科学基金(61163018,61262051,61363055) 教育部“春晖计划”合作科研项目(Z2012093) 国家社科基金(13BYY141) “长江学者和创新团队发展计划”创新团队资助项目(IRT1068) 青海省科技厅应用基础研究计划基金(2011-Z-755,2011-Z-754) 青海师范大学科研创新计划基金

关键词中文信息处理向量模型稀疏域模型构件 Chinese information processing vector space model sparse-land model components

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献17

1百度百科.藏文[EB/OL].http://baike.baidu.corn/view/230052.htm,2013-01-12.
2才旦夏茸.藏文文法详解[M].西宁:青海民族出版社,1988.
3才智杰,才让卓玛.基于语料库的藏文字属性分析系统设计[J].计算机工程,2011,37(22):270-272. 被引量：10
4才智杰.藏文自动分词系统中紧缩词的识别[J].中文信息学报,2009,23(1):35-37. 被引量：71
5黄鹤鸣,契嘎.德熙嘉措.基于DUCET的藏文排序方法[J].中文信息学报,2008,22(4):109-113. 被引量：11
6才让卓玛,才智杰.藏文字频统计系统中字构件分解算法[J].计算机工程与科学,2011,33(3):159-162. 被引量：4
7才让卓玛,才智杰.现代藏文字构件分解方法[J].青海大学学报（自然科学版）,2010,28(4):83-86. 被引量：7
8CaiZhijie,CaiRangzhuoma. Statistical Analysis for Fre- quency of the Corpus-based Modern Tibetan Basic ComponentsEC~//Proceedings of 2011 4th Internation- al Conference on Intelligent Networks and Intelligent Systems (ICINIS), Kunming, China, Nov. 1 3,2011 : 214-217.
9陈玉忠,俞士汶.藏文信息处理技术的研究现状与展望[J].中国藏学,2003(4):97-107. 被引量：68
10扎西次仁.《中华大藏经·丹珠尔》藏文对勘本字频统计分析[J].中国藏学,1997(2):122-133. 被引量：19

二级参考文献72

1郑玉玲.藏语方言语音量化分析[J].民族语文,1998(5):42-50. 被引量：4
2罗圣仪.计算机处理藏文的初步探讨[J].民族语文,1986(3):50-54. 被引量：3
3孙宏开,郑玉玲.计算机进行藏缅语语音相关分析的尝试[J].语言研究,1994,14(2):168-180. 被引量：3
4鲍怀翘,徐昂,陈嘉猷.藏语拉萨话语音声学参数数据库[J].民族语文,1992(5):10-20. 被引量：15
5张连生.计算机藏文文字处理的设计[J].民族语文,1983(5):37-43. 被引量：6
6于道泉.藏文数码代字[J].民族语文,1982(3):1-7. 被引量：3
7张连生.藏文号码代字及其计算机排索[J].语言研究,1983,3(2):35-40. 被引量：3
8江荻.藏文信息处理基本属性分析[J].民族语文,1995(2):63-68. 被引量：5
9林河水,程伟,曹晖,李文波,吴健,孙玉芳.一种符合ISO14651语义的藏文排序实现方法[J].中文信息学报,2004,18(5):36-41. 被引量：19
10孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：102

共引文献207

1尹蔚彬,戚路堯.周季文藏学研究探析[J].西藏民族大学学报（哲学社会科学版）,2023,44(6):27-32.
2才智杰,才让卓玛,孙茂松.一种多基元联合训练的藏文词向量表示方法[J].中文信息学报,2020(5):44-49. 被引量：4
3贺胜,卢亚军,王正平.基于IMM-IME结构的藏文输入法研究[J].西北民族大学学报（自然科学版）,2008,29(1):29-32. 被引量：1
4尼玛扎西,李志蜀,群诺,普顿,拥措,陈安龙.一种在移动电话上实现藏文处理的方法[J].四川大学学报（工程科学版）,2009,41(1):162-167. 被引量：9
5才华.基于小字符集的藏文自动分词技术研究[J].西藏大学学报（社会科学版）,2013,28(5):43-47. 被引量：3
6索南才让.面向自然语言处理的藏语虚词la格研究[J].西藏大学学报（社会科学版）,2013,28(5):48-52. 被引量：2
7仁青诺布,高红梅,王国宏,杨鹏,索朗旺堆.藏文在线输入法的设计与实现[J].西藏大学学报（社会科学版）,2013,28(4):65-69. 被引量：1
8高定国,郭鑫.TSF藏文输入法的设计与实现[J].西藏大学学报（社会科学版）,2014,29(5):71-80.
9才华.藏文组字部件的自动识别与字排序研究[J].西藏大学学报（社会科学版）,2014,29(5):81-86. 被引量：1
10完么扎西.藏语词语兼类情况及识别规则库[J].西藏大学学报（社会科学版）,2014,29(5):87-94.

同被引文献100

1华旦扎西,才智杰,班玛宝.一种基于TC_LSTM的藏文词拼写检查方法[J].中文信息学报,2020,34(5):50-55. 被引量：5
2李永宏,孔江平,于洪志.藏语文-音自动规则转换及其实现[J].清华大学学报（自然科学版）,2008,48(S1):621-626. 被引量：20
3尼玛扎西,李志蜀,群诺,普顿,拥措,陈安龙.一种在移动电话上实现藏文处理的方法[J].四川大学学报（工程科学版）,2009,41(1):162-167. 被引量：9
4索南尖措.藏语动词的黏着性及屈折性变化研究[J].西藏大学学报（社会科学版）,2013,28(4):70-75. 被引量：2
5德吉梅朵.面向藏语语料库建设的数量词的分类研究[J].剑南文学（经典教苑）（下）,2013(1):228-229. 被引量：1
6王维兰,陈万军.藏文字丁、音节频度及其信息熵[J].术语标准化与信息技术,2004(2):27-31. 被引量：17
7罗圣仪,江虹.藏文轻印刷系统[J].计算机世界月刊,1993(7):73-73. 被引量：2
8高定国,龚育昌.现代藏字全集的属性统计研究[J].中文信息学报,2005,19(1):71-75. 被引量：34
9扎西次仁.藏文的排序规则及其计算机自动排序的实现[J].中国藏学,1999(4):128-135. 被引量：16
10江荻,董颖红.藏字叠加结构线性处理统计分析[J].中文信息,1994,11(4):44-46. 被引量：11

引证文献6

1才智杰,才让卓玛,孙茂松.一种多基元联合训练的藏文词向量表示方法[J].中文信息学报,2020(5):44-49. 被引量：4
2高定国.藏文信息处理研究进展[J].广西科学院学报,2018,34(1):1-11. 被引量：7
3才智杰,孙茂松,才让卓玛.一种基于向量模型的藏文字拼写检查方法[J].中文信息学报,2018,32(9):47-55. 被引量：12
4苗晗,车文刚,朱倩倩.一种藏文雕刻字体多样性表达方法[J].信息技术,2020,44(9):129-132.
5普哇拉毛,尼玛扎西,道吉扎西,王超.藏文文本校对技术研究进展[J].高原科学研究,2023,7(2):99-104.
6才智杰,孙茂松,才让卓玛.藏文词向量相似度和相关性评测集构建[J].中文信息学报,2019,0(7):81-87. 被引量：6

二级引证文献28

1华旦扎西,才智杰,班玛宝.一种基于TC_LSTM的藏文词拼写检查方法[J].中文信息学报,2020,34(5):50-55. 被引量：5
2才智杰,才让卓玛,孙茂松.一种多基元联合训练的藏文词向量表示方法[J].中文信息学报,2020(5):44-49. 被引量：4
3张瑞.藏文在线评论情感分析研究综述[J].智库时代,2018(35):206-208. 被引量：2
4头旦才让,尼玛扎西.改革开放以来西藏藏文信息化发展综述[J].西藏研究,2018(5):182-187. 被引量：5
5严李强,周建朋,冯郅皓.藏文词库自扩充学习算法的设计与实现[J].高原科学研究,2019,3(3):106-112. 被引量：1
6冷本杰,高定国.藏文数词自动检错研究[J].电子技术与软件工程,2019,0(21):244-246.
7林颖,吾守尔·斯拉木.机器翻译评价系统研究与设计[J].信息通信,2020(5):26-28. 被引量：2
8苗晗,车文刚,朱倩倩.一种藏文雕刻字体多样性表达方法[J].信息技术,2020,44(9):129-132.
9马爽.中国少数民族文字网络搜索引擎关键技术研究[J].无线互联科技,2020,17(13):84-86. 被引量：1
10色差甲,慈祯嘉措,才让加,华果才让.基于神经网络的藏文正字检错法[J].中文信息学报,2020,34(12):48-53. 被引量：3

1高定国,欧珠.藏文编码字符集的优化研究[J].中文信息学报,2008,22(4):119-122. 被引量：2
2格桑元旦.浅议多媒体技术在高中藏语文教学中的应用[J].大东方,2016,0(7):243-243. 被引量：1
3春燕.基于藏文音节特征的模式匹配算法的研究[J].计算机光盘软件与应用,2014,17(15):119-120. 被引量：5
4桑德吉.运用多媒体进行藏语文教学的应用研究[J].中国信息技术教育,2015(C00):188-188.
5黄鹤鸣,契嘎.德熙嘉措.基于DUCET的藏文排序方法[J].中文信息学报,2008,22(4):109-113. 被引量：11
6叶寒,李景霞,赵慧娟.一种基于特征的构件搜索方式[J].山东科技大学学报（自然科学版）,2002,21(2):31-34.
7李改维.陕西党家村环境构件特征探析[J].中国城市林业,2010,8(4):57-59. 被引量：1
8杨成甫,贾彦民,吴健.Web服务器端藏文字符串长度的近似算法[J].计算机工程与设计,2007,28(5):1173-1175.
9赵英亮,王黎明,韩焱.Research on CT characteristics reconstruction technology[J].Journal of Measurement Science and Instrumentation,2016,7(2):129-135.
10阿绒莫,王小平.藏民族地区的藏语文教学的几点思考[J].教育管理与艺术,2014,0(9):250-250. 被引量：1

中文信息学报

2016年第2期

浏览历史

内容加载中请稍等...

藏文字符的向量模型及构件特征分析被引量：6

参考文献17

二级参考文献72

共引文献207

同被引文献100

引证文献6

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

藏文字符的向量模型及构件特征分析 被引量：6

参考文献17

二级参考文献72

共引文献207

同被引文献100

引证文献6

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

藏文字符的向量模型及构件特征分析被引量：6