期刊文献+
共找到520篇文章
< 1 2 26 >
每页显示 20 50 100
Semi-supervised Document Clustering Based on Latent Dirichlet Allocation (LDA) 被引量:2
1
作者 秦永彬 李解 +1 位作者 黄瑞章 李晶 《Journal of Donghua University(English Edition)》 EI CAS 2016年第5期685-688,共4页
To discover personalized document structure with the consideration of user preferences,user preferences were captured by limited amount of instance level constraints and given as interested and uninterested key terms.... To discover personalized document structure with the consideration of user preferences,user preferences were captured by limited amount of instance level constraints and given as interested and uninterested key terms.Develop a semi-supervised document clustering approach based on the latent Dirichlet allocation(LDA)model,namely,pLDA,guided by the user provided key terms.Propose a generalized Polya urn(GPU) model to integrate the user preferences to the document clustering process.A Gibbs sampler was investigated to infer the document collection structure.Experiments on real datasets were taken to explore the performance of pLDA.The results demonstrate that the pLDA approach is effective. 展开更多
关键词 supervised clustering document latent dirichlet instance captured constraints labeled interested
在线阅读 下载PDF
Unsupervised Feature Selection for Latent Dirichlet Allocation 被引量:1
2
作者 徐蔚然 杜刚 +2 位作者 陈光 郭军 杨洁 《China Communications》 SCIE CSCD 2011年第5期54-62,共9页
As a generative model,Latent Dirichlet Allocation Model,which lacks optimization of topics' discrimination capability focuses on how to generate data,This paper aims to improve the discrimination capability throug... As a generative model,Latent Dirichlet Allocation Model,which lacks optimization of topics' discrimination capability focuses on how to generate data,This paper aims to improve the discrimination capability through unsupervised feature selection.Theoretical analysis shows that the discrimination capability of a topic is limited by the discrimination capability of its representative words.The discrimination capability of a word is approximated by the Information Gain of the word for topics,which is used to distinguish between "general word" and "special word" in LDA topics.Therefore,we add a constraint to the LDA objective function to let the "general words" only happen in "general topics" other than "special topics".Then a heuristic algorithm is presented to get the solution.Experiments show that this method can not only improve the information gain of topics,but also make the topics easier to understand by human. 展开更多
关键词 pattern recognition unsupervised feature selection latent dirichlet allocation general topic special topic
在线阅读 下载PDF
Analysis of pedestrian-related crossing behavior at intersections:A Latent Dirichlet Allocation approach 被引量:2
3
作者 Zhen Yang Zhe Gong +1 位作者 Qiuchen Zhang Jing Wang 《International Journal of Transportation Science and Technology》 2023年第4期1052-1063,共12页
To study the intention behind pedestrian crossing behavior,this study extracts the trajectory data of vehicles and pedestrians from intersection videos.Based on the classic traffic conflict theory,TAdv is selected as ... To study the intention behind pedestrian crossing behavior,this study extracts the trajectory data of vehicles and pedestrians from intersection videos.Based on the classic traffic conflict theory,TAdv is selected as the primary indicator to describe the pedestrian-vehicle conflict,and pedestrian crossing events are defined to represent the interaction state of pedestrians and conflicting objects at a certain time in the crossing conflict.This paper proposes a Kalman filter-based crossing event recognition method,and then uses the topic model in natural language processing technology to mine pedestrian behavior"topics"behind different crossing events,and obtains an LDA-based pedestrian crossing description model.The results show that:on the whole,pedestrians have high requirements for the right of way and will not easily change their behavior.Pedestrians have higher speeds in conflicts with non-motorized vehicles than motorized vehicles and have greater expectations of victory in conflict games.Pedestrians often adopt conservative behaviors at low risk and choose other strategies after the conflict has evolved to a certain degree(high risk).There are two types of pedestrians with the highest demand for the right of way.One is the aggressive pedestrians,who will adopt aggressive rushing strategies when facing nonmotor vehicles while adopting the most conservative avoidance strategies when facing motor vehicles.The other is the pedestrians with small impacts from the outside world,whose crossing state will not easily be affected by vehicles and changes in traffic. 展开更多
关键词 Traffic safety Pedestrian crossing behavior latent dirichlet allocation INTERSECTION
在线阅读 下载PDF
融合LDA-BN的船舶碰撞事故致因分析
4
作者 邵波 刘巧 +2 位作者 柯善钢 郑霞忠 贺语琴 《安全与环境学报》 北大核心 2025年第1期157-164,共8页
为探究船舶碰撞事故致因及其关系,提升航运安全管理水平,研究提出融合狄利克雷分布(Latent Dirichlet allocation,LDA)与贝叶斯网络(Bayesian Network,BN)的船舶碰撞事故致因分析方法。首先,运用LDA主题模型挖掘361份船舶碰撞事故调查报... 为探究船舶碰撞事故致因及其关系,提升航运安全管理水平,研究提出融合狄利克雷分布(Latent Dirichlet allocation,LDA)与贝叶斯网络(Bayesian Network,BN)的船舶碰撞事故致因分析方法。首先,运用LDA主题模型挖掘361份船舶碰撞事故调查报告,提取27个事故致因主题;其次,利用事故树方法厘清调查报告中致因间的影响关系,构建事故致因贝叶斯网络结构,使用期望最大化算法进行贝叶斯网络参数学习,确定各节点的条件概率,构建事故致因贝叶斯网络模型;最后,通过逆向推理分析、最大致因链分析及敏感性分析,找出导致船舶碰撞事故发生的主要致因因素。结果显示:安全管理不到位、疏忽瞭望、事发水域通航环境复杂是引发船舶碰撞事故可能性大的致因,航线保持不当、应急处置不当、违规穿越锚地是导致船舶碰撞事故发生的最敏感致因因素。 展开更多
关键词 安全社会工程 船舶碰撞 狄利克雷分布主题模型 贝叶斯网络 事故致因
在线阅读 下载PDF
基于LDA模型的卫生健康媒体数据时间序列主题分析
5
作者 吴旭生 查亚东 +4 位作者 张冬云 彭祖胜 林圣 刘宇锋 和晓峰 《医学信息学杂志》 2025年第2期62-67,75,共7页
目的/意义探索卫生健康领域媒体数据主题及其演化趋势。方法/过程以深圳广电媒资数据库中的160549条卫生健康领域媒体数据为研究对象,采用隐含狄利克雷分布模型结合时间序列进行主题聚类分析,并结合专家经验,进行对比分析。结果/结论得... 目的/意义探索卫生健康领域媒体数据主题及其演化趋势。方法/过程以深圳广电媒资数据库中的160549条卫生健康领域媒体数据为研究对象,采用隐含狄利克雷分布模型结合时间序列进行主题聚类分析,并结合专家经验,进行对比分析。结果/结论得到25个与卫生健康领域强相关的主题,根据主题强度演化趋势分为6组。主题建模的内容划分和强度变化有效反映了卫生健康领域热点事件的发生及其演进过程。利用隐含狄利克雷分布模型进行主题建模,结合时间序列分析主题分布、解读主题意义,有助于探索媒体数据在卫生健康领域的应用,为卫生健康公共事业赋能。 展开更多
关键词 卫生健康媒体数据 隐含狄利克雷分布模型 热点事件 主题演化
在线阅读 下载PDF
一种新的目标检测方法:Latent Dirichlet classification 被引量:3
6
作者 丁轶 郭乔进 李宁 《南京大学学报(自然科学版)》 CSCD 北大核心 2012年第2期214-220,共7页
图像目标检测的任务是通过对图像分块或者分区域提取特征,进行学习和分类,从而检测出目标在图像中的位置.基于潜在迪利克雷分布模型,提出一种应用于目标检测的主题模型latentDirichlet classification(LDC),结合图像连续值局部特征和共... 图像目标检测的任务是通过对图像分块或者分区域提取特征,进行学习和分类,从而检测出目标在图像中的位置.基于潜在迪利克雷分布模型,提出一种应用于目标检测的主题模型latentDirichlet classification(LDC),结合图像连续值局部特征和共生关系来进行目标检测.LDC模型将latentDirichlet allocation(LDA)生成的主题信息作为权重赋予样本,生成多份样本,然后利用多份样本训练多个分类器进行集成分类.实验结果表明利用LDC模型能有效提高检测精度. 展开更多
关键词 潜在迪利克雷分布 目标检测 变分推理 主题模型
在线阅读 下载PDF
Fuzzy Based Latent Dirichlet Allocation for Intrusion Detection in Cloud Using ML
7
作者 S.Ranjithkumar S.Chenthur Pandian 《Computers, Materials & Continua》 SCIE EI 2022年第3期4261-4277,共17页
The growth of cloud in modern technology is drastic by provisioning services to various industries where data security is considered to be common issue that influences the intrusion detection system(IDS).IDS are consi... The growth of cloud in modern technology is drastic by provisioning services to various industries where data security is considered to be common issue that influences the intrusion detection system(IDS).IDS are considered as an essential factor to fulfill security requirements.Recently,there are diverse Machine Learning(ML)approaches that are used for modeling effectual IDS.Most IDS are based on ML techniques and categorized as supervised and unsupervised.However,IDS with supervised learning is based on labeled data.This is considered as a common drawback and it fails to identify the attack patterns.Similarly,unsupervised learning fails to provide satisfactory outcomes.Therefore,this work concentrates on semi-supervised learning model known as Fuzzy based semi-supervised approach through Latent Dirichlet Allocation(F-LDA)for intrusion detection in cloud system.This helps to resolve the aforementioned challenges.Initially,LDA gives better generalization ability for training the labeled data.Similarly,to handle the unlabelled data,Fuzzy model has been adopted for analyzing the dataset.Here,preprocessing has been carried out to eliminate data redundancy over network dataset.In order to validate the efficiency of F-LDA towards ID,this model is tested under NSL-KDD cup dataset is a common traffic dataset.Simulation is done inMATLAB environment and gives better accuracy while comparing with benchmark standard dataset.The proposed F-LDAgives better accuracy and promising outcomes than the prevailing approaches. 展开更多
关键词 Cloud security fuzzy model latent dirichlet allocation preprocessing NSL-KDD
在线阅读 下载PDF
基于LDA模型和意象图式的产品隐喻设计方法研究
8
作者 侯士江 卫建君 +3 位作者 孙宇辰 鲁莹 王佳棋 廉博杰 《包装工程》 CAS 北大核心 2024年第16期138-149,170,共13页
目的为实现隐喻设计方法的喻体选择和隐喻转译,结合LDA模型和意象图式提出一种新型产品隐喻设计方法。方法应用LDA聚类分析始源域中事件的情绪体验,获取用户在始源域中的主题喻体。基于深度访谈和图式表征分析提取意象图式,并通过AHP评... 目的为实现隐喻设计方法的喻体选择和隐喻转译,结合LDA模型和意象图式提出一种新型产品隐喻设计方法。方法应用LDA聚类分析始源域中事件的情绪体验,获取用户在始源域中的主题喻体。基于深度访谈和图式表征分析提取意象图式,并通过AHP评价排序获取重要图式转译因子。将图式因子进行组合表述,联想产品相应功能特征,完成意象喻体到产品主体的转译。结果以减压产品为例进行设计实践,通过LDA聚类获取了感官放松、情感满足、体验良性发展、探索未知、无意识本能、体能释放六大主题与相应模态,以及与主题对应的图示因子,并以可视化桌面蓝牙音箱为设计载体,从视觉、听觉和触觉模态介入,结合图式联想完成了音乐播放、探索互动、自动休眠和情绪释放4个功能隐喻设计。利用加权算法对设计方案进行测试评估,验证了设计方法的合理性。结论从隐喻设计现状出发,探索了基于LDA模型和意象图式的产品隐喻设计方法并加以实践,验证理论与方法的可行性与有效性,为产品隐喻设计乃至其他情感价值类产品的设计研究提供了优质案例与借鉴。 展开更多
关键词 产品设计 隐喻设计 lda模型 意象图式
在线阅读 下载PDF
基于LDA主题模型的智慧健康养老服务与管理人才岗位需求分析 被引量:1
9
作者 达朝锦 吴臣 +4 位作者 蔡婷婷 吉珍颖 陈佳琳 苗晓琦 袁长蓉 《护士进修杂志》 2024年第6期664-669,共6页
目的应用潜在狄利克雷分配(LDA)主题模型挖掘养老服务与管理人才的岗位需求,为相关人才培养提供依据。方法采用Python程序软件抓取前程无忧、智联招聘、猎聘网、养老网、丁香人才网等网站上与养老服务与管理人才相关的招聘信息,并进行... 目的应用潜在狄利克雷分配(LDA)主题模型挖掘养老服务与管理人才的岗位需求,为相关人才培养提供依据。方法采用Python程序软件抓取前程无忧、智联招聘、猎聘网、养老网、丁香人才网等网站上与养老服务与管理人才相关的招聘信息,并进行数据清洗,借助LDA主题模型对数据进行主题识别,分析岗位需求。结果共采集招聘信息3684条。数据清洗后获得2120条有效数据,包含健康照护类1161条,经营与管理类959条。招聘信息主要分布在华东、华北和华南地区。2类岗位各自析出8个岗位需求主题,按照主题强度,健康照护岗位析出的需求主题依次为:性格品质、生活及心理照料能力、疾病照料能力、职业礼仪和态度、急救与安全照料能力、职业通用能力、活动组织及服务管理能力、信息技术和老年政策法规知识;经营与管理岗位析出的需求主题依次为:机构运营管理能力、性格品质、市场开发与定位能力、客户维护与产品销售能力、职业礼仪和态度、职业通用能力、活动组织和策划能力、信息技术和老年政策法规知识。结论健康照护和经营与管理岗位知识和技能需求存在差异,但两者均重视养老服务与管理人才的人文素养和信息化应用能力,上述需求特征可为相关人才培养提供一定参考。 展开更多
关键词 lda主题模型 养老服务与管理 网络招聘 岗位需求
在线阅读 下载PDF
基于LDA主题模型的在途驾驶风格识别方法
10
作者 汪娇 刘锴 +2 位作者 栗慧哲 曹鹏 王秋玲 《中国安全科学学报》 CAS CSCD 北大核心 2024年第10期197-204,共8页
为增强人机共驾条件下智能系统对个体驾驶行为的理解,提出一种基于潜在狄利克雷分配(LDA)主题模型的在途驾驶风格识别方法,从多维度挖掘车辆轨迹信息,快速提取和识别驾驶员潜在驾驶风格特征。首先,建立驾驶行为语义理解规则,从驾驶作业... 为增强人机共驾条件下智能系统对个体驾驶行为的理解,提出一种基于潜在狄利克雷分配(LDA)主题模型的在途驾驶风格识别方法,从多维度挖掘车辆轨迹信息,快速提取和识别驾驶员潜在驾驶风格特征。首先,建立驾驶行为语义理解规则,从驾驶作业的场景感知层、模式层、操作层以及车辆状态层出发,将连续的轨迹时序数据阐述为驾驶行为语义理解词汇;其次,根据主题困惑度和主题一致性指标定义4类习惯性驾驶风格:稳定型、保守型、适中型以及激进型;最后,将每位驾驶员的在途驾驶风格识别为上述驾驶风格的概率组合。结果表明:所提出的在途驾驶风格识别方法考虑驾驶员在驾驶过程中的异质性和不一致性,能够解释同一驾驶员在不同驾驶环境下表现出差异化驾驶风格的现象,同时,有助于提高驾驶风格在途识别的全面性以及可理解性。 展开更多
关键词 潜在狄利克雷分配(lda)主题模型 在途驾驶风格 轨迹数据 语义理解 驾驶行为
在线阅读 下载PDF
国内社区养老服务热点分析——基于LDA模型与生命周期理论
11
作者 殷彩明 袁永旭 +2 位作者 王涟 孙一凡 陈俊冶 《医学信息学杂志》 CAS 2024年第10期47-52,97,共7页
目的/意义梳理现有文献,分析社区养老服务研究的主要方向,为完善社区养老服务提供科学建议。方法/过程通过中国知网数据库获取文献数据,结合生命周期理论,将相关研究历程分为3个阶段,通过LDA模型识别各阶段主题变化,分析该领域研究热点... 目的/意义梳理现有文献,分析社区养老服务研究的主要方向,为完善社区养老服务提供科学建议。方法/过程通过中国知网数据库获取文献数据,结合生命周期理论,将相关研究历程分为3个阶段,通过LDA模型识别各阶段主题变化,分析该领域研究热点及发展趋势并提出见解。结果/结论国内社区养老服务研究聚焦于养老模式、服务体系建设、农村及社区服务,旨在提供全面、专业的服务,提高服务质量,满足老年人的多元需求。社区养老服务仍是社会关注的热点,未来该领域应加强服务评估、重视人才建设、充分利用数字技术。 展开更多
关键词 社区养老服务 隐含狄利克雷分布模型 生命周期
在线阅读 下载PDF
基于LDA与双向GRU的借阅主题热度预测
12
作者 陈志辉 吴克晴 +1 位作者 陈嘉超 秦泽豪 《软件导刊》 2024年第7期51-57,共7页
图书借阅主题分析能够挖掘读者借阅喜好和阅读规律,通过使用借阅主题热度预测模型能够预测读者借阅主题热度变化趋势,对图书馆开展阅读推广活动具有重要意义。为了解决图书借阅主题提取、主题热度预测问题,提出基于LDA与双向GRU神经网... 图书借阅主题分析能够挖掘读者借阅喜好和阅读规律,通过使用借阅主题热度预测模型能够预测读者借阅主题热度变化趋势,对图书馆开展阅读推广活动具有重要意义。为了解决图书借阅主题提取、主题热度预测问题,提出基于LDA与双向GRU神经网络的借阅主题热度预测模型。该算法通过LDA算法提取读者不同时间段中的借阅图书特征和借阅主题,在计算不同时间段借阅主题热度、构建借阅主题热度序列数据集的基础上,构造基于双向GRU神经网络的主题热度预测模型以预测未来主题热度变化趋势,并在厦门大学图书馆纸质文献借阅记录数据集上进行实验评估。实验结果表明,模型能准确获得借阅主题与关键词之间的关系,与机器学习等算法比较可知,该模型能有效降低借阅主题热度预测误差。 展开更多
关键词 热度预测 借阅主题发现 深度学习 双向门控循环单元 潜在狄利克雷分配
在线阅读 下载PDF
基于LDA模型的元宇宙主题挖掘与演化
13
作者 陈加元 刘彦 《科技和产业》 2024年第23期279-287,共9页
检索WoS核心数据库关于元宇宙文献(保留文献的摘要部分),依靠Python进行LDA(潜在狄利克雷分配)模型构建,通过困惑度以及主题一致性确定最佳主题数,并抽取文本下词频最高的11个主题,对元宇宙相关文献进行主题抽取与挖掘,运用WordCloud技... 检索WoS核心数据库关于元宇宙文献(保留文献的摘要部分),依靠Python进行LDA(潜在狄利克雷分配)模型构建,通过困惑度以及主题一致性确定最佳主题数,并抽取文本下词频最高的11个主题,对元宇宙相关文献进行主题抽取与挖掘,运用WordCloud技术、桑基图(主题相似度)进行主题演化分析,从而了解元宇宙发展状态以及演化趋势。结果表明:目前关于元宇宙的研究主要在“元宇宙技术”和“元宇宙应用”方面,词云分析中关键词“tech-nolog”以及“virtual”较为突出;从主题热度分析来看,主题4(教育元宇宙研究)、主题7(元宇宙技术研究)、主题8(元宇宙应用研究)是目前元宇宙研究的热点;从主题演化分析来看,第1阶段(2018—2022年)中主题2元宇宙模型研究和主题8元宇宙技术研究表现出较强的演化能力,第2阶段(2023—2024年)的主题4元宇宙体验研究和主题8元宇宙场景构建研究演化能力强,且与相邻主题相似性高。 展开更多
关键词 元宇宙 潜在狄利克雷分配(lda)模型 主题挖掘 主题演化
在线阅读 下载PDF
基于LDA和ISM模型的疫苗接种意愿研究
14
作者 马丽荣 洪小娟 +1 位作者 郑惠莉 吴林海 《江苏科技大学学报(自然科学版)》 CAS 2024年第1期104-110,共7页
从信息化语境中挖掘社交媒体平台中的舆情数据,尝试更加系统地分析新冠疫苗接种意愿多重影响因素间的关系.利用网络爬虫技术抓爬社交媒体Twitter平台中的数据,借助潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型识别影响新冠... 从信息化语境中挖掘社交媒体平台中的舆情数据,尝试更加系统地分析新冠疫苗接种意愿多重影响因素间的关系.利用网络爬虫技术抓爬社交媒体Twitter平台中的数据,借助潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型识别影响新冠疫苗接种意愿的因素,并运用解释结构模型方法(interpretative structural modeling method,ISM)辅助建模,构建多级层次递阶结构模型,梳理和分析各项影响因素之间的逻辑层次关系.结果表明:通过LDA和ISM模型可以对获取到的因素集进行结构化处理,并根据ISM模型的逻辑结构,将影响新冠疫苗接种意愿的4个层级划分为深层、中间层和表层,不同层级对疫苗接种意愿的影响程度不同.研究结果可为提升民众对新冠疫苗的接受意愿和接种倾向提供相应的决策支持和参考价值. 展开更多
关键词 新冠疫苗 接种意愿 潜在狄利克雷分配 解释结构模型
在线阅读 下载PDF
基于改进LDA算法的电力用户咨询文本分类算法
15
作者 李竹青 侯本忠 +2 位作者 曹培祥 王一蓉 李向阳 《太赫兹科学与电子信息学报》 2024年第12期1400-1406,共7页
针对目前情感极性分析中电力咨询短文本的准确性较低的问题,提出一种基于改进潜在狄利克雷分配(LDA)算法的电力用户咨询文本分类算法。在分析电力咨询短文本与情感的关联关系基础上,定义了基于情感词共现袋、主题特殊词以及主题关系词... 针对目前情感极性分析中电力咨询短文本的准确性较低的问题,提出一种基于改进潜在狄利克雷分配(LDA)算法的电力用户咨询文本分类算法。在分析电力咨询短文本与情感的关联关系基础上,定义了基于情感词共现袋、主题特殊词以及主题关系词的概念;为提高语义分析的质量,设计了改进LDA算法的电力用户咨询文本分类算法执行流程。实验表明,所提模型表现出优异性能,平均精确度和平均召回率为90.91%和85.03%。所提模型可充分发挥多模型集成优势,有效提升模型性能。 展开更多
关键词 电力咨询 文本分类 主题分析 卷积神经网络 潜在狄利克雷分配
在线阅读 下载PDF
双车道公路超车行为安全研究进展
16
作者 戢晓峰 俸才梅 +2 位作者 李武 韩春阳 覃文文 《安全与环境学报》 北大核心 2025年第1期21-40,共20页
双车道公路超车行为作为一项复杂且极为危险的驾驶行为,可能导致严重的交通事故,已成为驾驶行为研究中的热点和难点问题。聚焦双车道公路超车行为安全,运用潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)模型对该领域的潜在研究主... 双车道公路超车行为作为一项复杂且极为危险的驾驶行为,可能导致严重的交通事故,已成为驾驶行为研究中的热点和难点问题。聚焦双车道公路超车行为安全,运用潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)模型对该领域的潜在研究主题进行了归纳总结,梳理了超车视距评估与间隙接受决策行为建模、超车安全影响因素与碰撞风险评估、超车持续时间及交通仿真建模、超车碰撞预警系统安全分析4个主题的研究进展。结果表明:双车道公路超车行为安全研究总体上面临数据获取的难度、模型参数选择的不确定性、实际应用中的复杂性等局限性,主要体现在超车事故数据以及多车结队超车、弯道超车等非常规超车场景下的现场观测数据支撑较为薄弱;影响超车安全的道路、环境、驾驶员等因素难以被全面捕捉,增加了模型参数选择的不确定性;面对现实交通环境的复杂动态变化,超车模型的实时性、敏感性可能不足。在总结现有研究局限性的基础上,认为未来研究应从4个方面重点改进:一是完善超车视距的可靠性分析方法,拓展智能网联背景下的动态超车视距和间隙接受决策研究;二是强化多维因素对超车安全耦合影响机制的挖掘,构建超车风险的动态演化分析方法;三是深入解析异质交通流状态下超车持续时间与超车风险的关系,着力开发针对双车道公路超车的交通仿真软件;四是完善超车碰撞预警系统的微观驾驶行为和宏观交通运行影响分析,提升超车碰撞预警系统的集成应用研究。 展开更多
关键词 安全工程 双车道公路超车行为 研究进展 潜在狄利克雷分配模型 交通仿真
在线阅读 下载PDF
基于LDA模型的音乐推荐算法 被引量:15
17
作者 李博 陈志刚 +1 位作者 黄瑞 郑祥云 《计算机工程》 CAS CSCD 北大核心 2016年第6期175-179,184,共6页
互联网的普及以及音乐资源的电子化使得人们可以更方便地获得音乐资源。但随着音乐库变得越来越大、资源越来越丰富,人们已经很难准确及时地找到自己喜欢的音乐。因此,对于音乐网站而言,需要一个合适的音乐推荐算法向用户推荐音乐。根... 互联网的普及以及音乐资源的电子化使得人们可以更方便地获得音乐资源。但随着音乐库变得越来越大、资源越来越丰富,人们已经很难准确及时地找到自己喜欢的音乐。因此,对于音乐网站而言,需要一个合适的音乐推荐算法向用户推荐音乐。根据已有的基于音频信息的音乐推荐以及协同过滤方法,分析用户的音乐试听数据以及下载数据,并结合Latent Dirichlet分配(LDA)主题挖掘模型,提出一种音乐推荐算法。实验结果表明,与基于用户的协同过滤算法以及基于项目的协同过滤算法相比,该算法可以更加高效地向用户推荐感兴趣的音乐。 展开更多
关键词 协同过滤 音乐推荐 主题挖掘 latent dirichlet分配模型 吉布斯抽样 基于lda模型的音乐推荐
在线阅读 下载PDF
一种改进的LDA主题模型 被引量:47
18
作者 张小平 周雪忠 +3 位作者 黄厚宽 冯奇 陈世波 焦宏官 《北京交通大学学报》 CAS CSCD 北大核心 2010年第2期111-114,共4页
由于文档中的词符合幂律分布,使得LDA模型的主题分布向高频词倾斜,导致能够代表主题的多数词被少量的高频词淹没使得主题表达能力降低.通过一种高斯函数对特征词加权,改进LDA主题模型的主题分布.实验显示加权LDA模型获得的主题间的相关... 由于文档中的词符合幂律分布,使得LDA模型的主题分布向高频词倾斜,导致能够代表主题的多数词被少量的高频词淹没使得主题表达能力降低.通过一种高斯函数对特征词加权,改进LDA主题模型的主题分布.实验显示加权LDA模型获得的主题间的相关性以及复杂度(Perplexity)值都降低,说明改进模型在主题表达和预测性能方面都有所提高. 展开更多
关键词 lda dirichlet分布 加权主题模型
在线阅读 下载PDF
基于LDA话题演化研究方法综述 被引量:87
19
作者 单斌 李芳 《中文信息学报》 CSCD 北大核心 2010年第6期43-49,68,共8页
现实生活中不断有新话题的产生和旧话题的衰减,同时话题的内容也会随着时间发生变化。自动探测话题随时间的演化越来越受到人们的关注。Latent Dirichlet Allocation模型是近年提出的概率话题模型,已经在话题演化领域得到较为广泛的应... 现实生活中不断有新话题的产生和旧话题的衰减,同时话题的内容也会随着时间发生变化。自动探测话题随时间的演化越来越受到人们的关注。Latent Dirichlet Allocation模型是近年提出的概率话题模型,已经在话题演化领域得到较为广泛的应用。该文提出了话题演化的两个方面:内容演化和强度演化,总结了基于LDA话题模型的话题演化方法,根据引入时间的不同方式将目前的研究方法分为三类:将时间信息结合到LDA模型、对文本集合后离散和先离散方法。在详细叙述这三种方法的基础上,针对时间粒度、是否在线等多个特征进行了对比,并且简要描述了目前广泛应用的话题演化评测方法。文章最后分析了目前存在的挑战,并且对该研究方向进行了展望。 展开更多
关键词 话题模型 话题演化 latent dirichlet allocation
在线阅读 下载PDF
基于LDA模型的文本分割 被引量:54
20
作者 石晶 胡明 +1 位作者 石鑫 戴国忠 《计算机学报》 EI CSCD 北大核心 2008年第10期1865-1873,共9页
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用.基于LDA模型的文本分割以LDA为语料库及文本建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,获取词汇的概率分布,使隐藏于片段内的不同主题... 文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用.基于LDA模型的文本分割以LDA为语料库及文本建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,获取词汇的概率分布,使隐藏于片段内的不同主题与文本表面的字词建立联系.实验以汉语的整句作为基本块,尝试多种相似性度量手段及边界估计策略,其最佳结果表明二者的恰当结合可以使片段边界的识别错误率远远低于其它同类算法. 展开更多
关键词 文本分割 lda模型 相似性度量 边界识别
在线阅读 下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部