期刊导航
期刊开放获取
唐山市科学技术情报研究..
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
多模态与文本预训练模型的文本嵌入差异研究
被引量:
3
1
作者
孙宇冲
程曦苇
+3 位作者
宋睿华
车万翔
卢志武
文继荣
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023年第1期48-56,共9页
为了详细地分析文本单模态预训练模型RoBERTa和图文多模态预训练模型WenLan文本嵌入的差异,提出两种定量比较方法,即在任一空间中,使用距离一个词最近的k近邻词集合表示其语义,进而通过集合间的Jaccard相似度来分析两个空间中词的语义变...
为了详细地分析文本单模态预训练模型RoBERTa和图文多模态预训练模型WenLan文本嵌入的差异,提出两种定量比较方法,即在任一空间中,使用距离一个词最近的k近邻词集合表示其语义,进而通过集合间的Jaccard相似度来分析两个空间中词的语义变化;将每个词与其k近邻词组成词对,分析词对之间的关系。实验结果表明,图文多模态预训练为更抽象的词(如成功和爱情等)带来更多的语义变化,可以更好地区分反义词,发现更多的上下义词,而文本单模态预训练模型更擅长发现同义词。另外,图文多模态预训练模型能够建立更广泛的词之间的相关关系。
展开更多
关键词
多模态预训练
文本表示
文本嵌入分析
在线阅读
下载PDF
职称材料
题名
多模态与文本预训练模型的文本嵌入差异研究
被引量:
3
1
作者
孙宇冲
程曦苇
宋睿华
车万翔
卢志武
文继荣
机构
中国人民大学高瓴人工智能学院
中国人民大学统计学院
北京智源人工智能研究院
哈尔滨工业大学计算学部
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023年第1期48-56,共9页
基金
北京高校卓越青年科学家计划(BJJWZYJH012019100020098)资助。
文摘
为了详细地分析文本单模态预训练模型RoBERTa和图文多模态预训练模型WenLan文本嵌入的差异,提出两种定量比较方法,即在任一空间中,使用距离一个词最近的k近邻词集合表示其语义,进而通过集合间的Jaccard相似度来分析两个空间中词的语义变化;将每个词与其k近邻词组成词对,分析词对之间的关系。实验结果表明,图文多模态预训练为更抽象的词(如成功和爱情等)带来更多的语义变化,可以更好地区分反义词,发现更多的上下义词,而文本单模态预训练模型更擅长发现同义词。另外,图文多模态预训练模型能够建立更广泛的词之间的相关关系。
关键词
多模态预训练
文本表示
文本嵌入分析
Keywords
multi-modal pre-training
text representation
text embedding analysis
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
多模态与文本预训练模型的文本嵌入差异研究
孙宇冲
程曦苇
宋睿华
车万翔
卢志武
文继荣
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部