期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于经验模式分解和匹配追踪的人脸检测 被引量:4
1
作者 聂祥飞 李春光 郭军 《计算机工程》 CAS CSCD 北大核心 2007年第14期30-32,共3页
提出了一种新的正面人脸检测算法。该方法利用经验模式分解和匹配追踪算法来提取人脸特征,训练Bayes分类器来进行分类判决。在FERET人脸库中与特征脸(Eigenfaces)方法进行了比较,实验结果表明,该算法的计算效率和检测精度均优于特征脸... 提出了一种新的正面人脸检测算法。该方法利用经验模式分解和匹配追踪算法来提取人脸特征,训练Bayes分类器来进行分类判决。在FERET人脸库中与特征脸(Eigenfaces)方法进行了比较,实验结果表明,该算法的计算效率和检测精度均优于特征脸方法。 展开更多
关键词 人脸检测 经验模式分解 匹配追踪算法 BAYES分类器
在线阅读 下载PDF
汉语连续语音识别结果评价算法研究 被引量:3
2
作者 刘刚 陈伟 郭军 《China Communications》 SCIE CSCD 2010年第2期132-138,共7页
在汉语语音识别中,由于汉语构词的特点,使得基于词的汉语语音识别结果评价不准确。论文对于传统连续语音识别结果评价算法进行了改进,提出了一种基于字词混合的汉语连续语音识别结果评价算法,可以有效完成基于词的识别结果评价,同时也... 在汉语语音识别中,由于汉语构词的特点,使得基于词的汉语语音识别结果评价不准确。论文对于传统连续语音识别结果评价算法进行了改进,提出了一种基于字词混合的汉语连续语音识别结果评价算法,可以有效完成基于词的识别结果评价,同时也将识别结果评价由四种情况(正确、替代、插入、删除)扩展到六种情况(增加了插入式替代和删除式替代),可以为语音识别的后处理提供更多有用的信息。实验表明,本文所提算法可以有效降低传统评价算法带来的虚假错误。 展开更多
关键词 语音识别 结果评价 动态规划 字词混合
在线阅读 下载PDF
基于Gabor小波的人脸检测 被引量:4
3
作者 聂祥飞 郭军 《计算机工程》 EI CAS CSCD 北大核心 2006年第21期44-46,共3页
提出了一种新的正面人脸检测算法。该方法组合了Gabor小波变换、输入图像的Gabor特征分析和Bayes分类器来进行正面人脸检测。对训练集的平均脸作Gabor小波变换得到40个投影向量;通过计算输入图像和这40个投影向量间的内积来提取图像的Ga... 提出了一种新的正面人脸检测算法。该方法组合了Gabor小波变换、输入图像的Gabor特征分析和Bayes分类器来进行正面人脸检测。对训练集的平均脸作Gabor小波变换得到40个投影向量;通过计算输入图像和这40个投影向量间的内积来提取图像的Gabor特征向量;训练Bayes分类器来进行正面人脸检测。实验结果表明,该算法的计算效率和检测精度均优于特征脸方法。 展开更多
关键词 人脸检测 GABOR小波 BAYES分类器
在线阅读 下载PDF
PRIS信息检索技术报告
4
作者 徐蔚然 胡佳妮 +4 位作者 陈博 茹昭 刘涛 王秀娟 郭军 《中文信息学报》 CSCD 北大核心 2006年第B03期96-101,共6页
建立索引、查询扩展和相似度计算等都是检索系统中的关键环节。Pills信息检索系统更侧重于构造简单有效的查询扩展算法。本报告介绍了北京邮电大学模式识别实验室参加2005年863信息检索测试的系统结构和具体方法。本报告分别介绍了预处... 建立索引、查询扩展和相似度计算等都是检索系统中的关键环节。Pills信息检索系统更侧重于构造简单有效的查询扩展算法。本报告介绍了北京邮电大学模式识别实验室参加2005年863信息检索测试的系统结构和具体方法。本报告分别介绍了预处理、分词、建立索引、查询扩展和相似度计算等部分。最后针对测试结果进行了分析。对正式评测的50个主题粜检索,获得的三项评价指标为:程序自动构造查询时,MAPm-0.1862,P@10=0.5180,R.Precision=0.2554;人工构造查询时,MAP=0.1862,P@10=0.5180,R-Precision=0.2554。 展开更多
关键词 信息检索 索引 查询扩展 相似度计算
在线阅读 下载PDF
基于受限波兹曼机的推荐算法研究 被引量:5
5
作者 陈达 高升 蔺志青 《软件》 2013年第12期156-159,185,共5页
本文针对推荐系统中传统推荐算法在处理较稀疏数据效果表现不佳的问题,将一种最新的机器学习方法带入到推荐算法中,利用多层波兹曼机组成的深度结构模型与传统最近邻推荐方法相结合,形成一种新的推荐模型算法。本文还利用有限步吉布斯... 本文针对推荐系统中传统推荐算法在处理较稀疏数据效果表现不佳的问题,将一种最新的机器学习方法带入到推荐算法中,利用多层波兹曼机组成的深度结构模型与传统最近邻推荐方法相结合,形成一种新的推荐模型算法。本文还利用有限步吉布斯采样的最小化散度差(Constrastive Divergence)方法解决了该模型的无监督训练问题,并且通过预训练和反馈微调使得模型的训练得以实现;最后利用深度结构抽取的抽象特征结合最近邻方法进行预测推荐。另外,本文利用传统基于相似度最近邻方法 ,矩阵分解方法和新模型算法在相关数据集上进行多组实验,实验结果表明该算法不仅在稀疏的数据上也表现出更好的效果,并且拥有着更快的收敛速度。 展开更多
关键词 推荐系统算法 受限波兹曼机 深度学习 吉布斯采样
在线阅读 下载PDF
基于个性信息的跨域推荐算法 被引量:5
6
作者 罗浩 高升 徐蔚然 《软件》 2013年第12期142-147,共6页
信息推荐系统主要根据已有的用户历史信息来对未知信息进行预测。但用户的活跃度往往使得数据集本身过于稀疏,从而使相关算法产生过拟合问题。跨域推荐算法是为了解决在单域推荐中常遇到的数据稀疏性问题,然而大多数的推荐算法在考虑共... 信息推荐系统主要根据已有的用户历史信息来对未知信息进行预测。但用户的活跃度往往使得数据集本身过于稀疏,从而使相关算法产生过拟合问题。跨域推荐算法是为了解决在单域推荐中常遇到的数据稀疏性问题,然而大多数的推荐算法在考虑共享信息时并未考虑单个数据域的个性信息。本文通过矩阵聚类方法来提取矩阵的潜在因式,区别数据集合之间的共享信息和自身信息。通过这种方法来做跨域推荐预测,并在几个现实中的数据集上与现有的一些推荐算法进行比较。 展开更多
关键词 算法理论 跨域推荐 潜在因式 个性信息
在线阅读 下载PDF
中文分词研究 被引量:6
7
作者 张黎 徐蔚然 《软件》 2012年第12期103-108,共6页
中文分词是中文文本处理和自然语言处理中最基本和最重要的研究,它效果的好坏直接影响到所在领域中进一步研究的效果。本文对于已有的基于词典,基于统计,基于理解的分词方法进行了详细的阐述和讨论,分析了它们的优点和不足,并且介绍了... 中文分词是中文文本处理和自然语言处理中最基本和最重要的研究,它效果的好坏直接影响到所在领域中进一步研究的效果。本文对于已有的基于词典,基于统计,基于理解的分词方法进行了详细的阐述和讨论,分析了它们的优点和不足,并且介绍了现在的难点,在此基础上,为中文分词的进一步发展提供了建议。 展开更多
关键词 计算机应用 自然语言处理 中文分词
在线阅读 下载PDF
基于词激活力的自动词发现 被引量:2
8
作者 张永田 徐蔚然 汪浩 《软件》 2012年第12期182-184,共3页
在使用计算机处理中文信息时,对词语的自动化发现技术有迫切的需求。因为在互联网时代,词语集合的更新换代非常之快,词语以非常快的节奏产生和消亡,这直接影响着对中文信息自动化处理的准确度和可靠性。为了解决这个难题,本文提出一种... 在使用计算机处理中文信息时,对词语的自动化发现技术有迫切的需求。因为在互联网时代,词语集合的更新换代非常之快,词语以非常快的节奏产生和消亡,这直接影响着对中文信息自动化处理的准确度和可靠性。为了解决这个难题,本文提出一种基于词激活力模型的中文词语发现方法。该方法将海量汉语语料建模成为有序的汉字序列,建立词激活力模型,分析字与字之间的联系程度,从而对任意两个汉字是否构成词语进行估计。在大规模语料集上的数据实验表明,该方法能够有效地对预料中的潜在词语进行自动化发现,达到了预期目标。 展开更多
关键词 自然语言处理 自动词发现 词激活力
在线阅读 下载PDF
一种结构化数据关系特征抽取和表示模型 被引量:9
9
作者 洪立印 徐蔚然 《软件》 2013年第12期148-151,共4页
WAF(词激活力)是一种基于统计的描述词与词关系的算法,WAF不单纯是考虑的词之间的关联,还考虑了词前后顺序,词与词之间的距离,包含了概率和语言规则两种信息量。本文提出一种实体结构化数据的关系特征抽取算法,并基于该特征实现实体聚... WAF(词激活力)是一种基于统计的描述词与词关系的算法,WAF不单纯是考虑的词之间的关联,还考虑了词前后顺序,词与词之间的距离,包含了概率和语言规则两种信息量。本文提出一种实体结构化数据的关系特征抽取算法,并基于该特征实现实体聚类。首先提取出实体结构化数据的语义和语境特征,以此来文本建模,然后对每个属性基于WAF值进行相似度计算,最后进行实体聚类。 展开更多
关键词 自然语言处理 实体特征抽取 实体关系挖掘
在线阅读 下载PDF
一种基于隐马尔科夫模型的波形文件主旋律基频提取算法 被引量:5
10
作者 龚君才 刘刚 《软件》 2013年第12期152-155,177,共5页
哼唱检索中通常以旋律的基频作为音乐特征进行检索,目前研究的哼唱检索系统都是基于MIDI音乐文件。但是,目前存在的MIDI音乐文件的数量非常少,基于波形文件的哼唱检索系统才是未来的发展趋势。本文针对单声道波形文件,研究了一种提取歌... 哼唱检索中通常以旋律的基频作为音乐特征进行检索,目前研究的哼唱检索系统都是基于MIDI音乐文件。但是,目前存在的MIDI音乐文件的数量非常少,基于波形文件的哼唱检索系统才是未来的发展趋势。本文针对单声道波形文件,研究了一种提取歌曲主旋律基频曲线的算法。该算法将隐马尔科夫模型和"谐波乐器/打击乐器声音分离"模型进行结合。实验表明该算法对主旋律基频提取具有很高的准确率。 展开更多
关键词 哼唱检索 主旋律 基频提取 隐马尔科夫模型 谐波乐器 打击乐器声音分离
在线阅读 下载PDF
基于自动机的微博在线突发话题检测算法 被引量:1
11
作者 谢乾龙 徐蔚然 《软件》 2012年第12期109-113,共5页
提出一种基于状态自动机的突发特征检测算法,针对微博数据长度小,语言不规范,噪声大,数据量大的特点,优化预处理过程和状态自动机模型参数;提出一种突发话题聚类算法,对特征词的词频向量表示进行改进,并引入基于词激活力(WAF)的词法特征... 提出一种基于状态自动机的突发特征检测算法,针对微博数据长度小,语言不规范,噪声大,数据量大的特点,优化预处理过程和状态自动机模型参数;提出一种突发话题聚类算法,对特征词的词频向量表示进行改进,并引入基于词激活力(WAF)的词法特征,使得聚类效果更加准确,得到的突发话题可读性更强。最后通过实验方法验证了算法的可行性。 展开更多
关键词 文本检索 突发话题检测 话题聚类
在线阅读 下载PDF
自动语言辨识的研究方法及发展概述 被引量:1
12
作者 王洪海 刘刚 郭军 《电脑与信息技术》 2007年第2期37-39,共3页
根据自动语言辨识研究中所采用的识别信息的不同,文章将研究中使用的方法归类为基于声学特征的方法、基于韵律特征的方法、基于音素识别的方法和基于高层语言信息的方法。通过对这些方法进行分类介绍并结合NIST的评测结果分析,阐述了近... 根据自动语言辨识研究中所采用的识别信息的不同,文章将研究中使用的方法归类为基于声学特征的方法、基于韵律特征的方法、基于音素识别的方法和基于高层语言信息的方法。通过对这些方法进行分类介绍并结合NIST的评测结果分析,阐述了近十几年来自动语言辨识研究的发展情况,最后对进一步研究中存在的问题和发展趋势进行了分析。 展开更多
关键词 自动语言辨识 滑动差分倒谱 连续语音识别 概述
在线阅读 下载PDF
关于网络语音的自动语言辨识系统研究
13
作者 王洪海 刘刚 郭军 《电脑与信息技术》 2007年第1期3-6,共4页
文章对从网络上采集的英语、德语、日语、法语、西班牙语等5个语种的语音和现有的汉语语音进行了自动语言辨识的研究,利用RASTA-PLP特征参数和贪婪期望最大算法为每个语种建立了高斯混合模型,并用多个说话人的语音进行了开集测试,讨论... 文章对从网络上采集的英语、德语、日语、法语、西班牙语等5个语种的语音和现有的汉语语音进行了自动语言辨识的研究,利用RASTA-PLP特征参数和贪婪期望最大算法为每个语种建立了高斯混合模型,并用多个说话人的语音进行了开集测试,讨论了网络语音和非网络语音对识别结果的影响,以及识别率与训练数据和GMM模型阶数的关系。实验结果表明,经过改进的基于声学特征的方法可以有效地应用到网络语音的自动语言辨识系统中。 展开更多
关键词 网络语音 自动语言辨识 RASTA—PLP 高斯混合模型 贪婪期望最大算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部