期刊文献+
共找到51篇文章
< 1 2 3 >
每页显示 20 50 100
关于人工智能数据投毒安全风险的解决方案研究
1
作者 刘宇鑫 江为强 +2 位作者 郭中元 路骁虎 唐双林 《保密科学技术》 2025年第2期12-15,共4页
本文简要介绍了数据投毒技术,并在分析人工智能所面临的数据投毒安全风险的基础上,重点从关键技术、投毒防御技术等方面论述了人工智能数据投毒检测技术与应用,并探讨了人工智能数据投毒检测技术未来的研究方向。
关键词 大模型 人工智能安全 数据安全
原文传递
刘兵:计算机技术可以解决的六个问题
2
作者 刘兵 郑艺龙(整理) 《中国教育网络》 2020年第8期61-61,共1页
2020 CCF未来计算机教育峰会上,美国伊利诺伊大学芝加哥分校杰出教授、北京大学王选计算机研究所讲席教授刘兵做了题为《在线教育:可能是计算机技术发展的一个黄金时机》的观点报告。刘兵认为,新冠疫情永久性地改变了全世界传统的教学... 2020 CCF未来计算机教育峰会上,美国伊利诺伊大学芝加哥分校杰出教授、北京大学王选计算机研究所讲席教授刘兵做了题为《在线教育:可能是计算机技术发展的一个黄金时机》的观点报告。刘兵认为,新冠疫情永久性地改变了全世界传统的教学和工作方式,这是一个历史时刻。计算机专业的专家、教授们应抓住这一机遇,从以下几个方面为全球的教育事业做出贡献。 展开更多
关键词 计算机教育 计算机技术 计算机专业 在线教育 刘兵 北京大学 芝加哥 永久性
在线阅读 下载PDF
王选院士的三个选择
3
作者 丛中笑 《中国科技财富》 2024年第11期68-69,共2页
1937年2月5日,王选生于上海的一个知识分子家庭。父亲为他取名“选”,是希望他在人生中能够选择正确的道路。选择做“好人”小学时期的王选品学兼优,被评为“品德好、受欢迎”的学生。多年以后,他总结说:“这一荣誉与我后来的成就有很... 1937年2月5日,王选生于上海的一个知识分子家庭。父亲为他取名“选”,是希望他在人生中能够选择正确的道路。选择做“好人”小学时期的王选品学兼优,被评为“品德好、受欢迎”的学生。多年以后,他总结说:“这一荣誉与我后来的成就有很大关系。青少年时代应努力按好人标准培养,只有先成为好人,才能做有益于国家和人民的好事。” 展开更多
关键词 知识分子家庭 王选 小学时期 青少年时代 品学兼优 院士 好人
在线阅读 下载PDF
文本到视频生成:研究现状、进展和挑战 被引量:2
4
作者 邓梓焌 何相腾 彭宇新 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第5期1632-1644,共13页
文本到视频生成旨在根据用户给定的文本描述生成语义一致、内容真实、时序连贯且符合逻辑的视频。该文首先介绍了文本到视频生成领域的研究现状,详细介绍了3类主流的文本到视频生成方法:基于循环网络与生成对抗网络(GAN)的生成方法,基于... 文本到视频生成旨在根据用户给定的文本描述生成语义一致、内容真实、时序连贯且符合逻辑的视频。该文首先介绍了文本到视频生成领域的研究现状,详细介绍了3类主流的文本到视频生成方法:基于循环网络与生成对抗网络(GAN)的生成方法,基于Transformer的生成方法和基于扩散模型的生成方法。这3类生成方法在视频生成任务上各有优劣:基于循环网络与生成对抗网络的生成方法能生成较高分辨率和时长的视频,但难以生成复杂的开放域视频;基于Transformer的生成方法有能力生成复杂的开放域视频,但受限于Transformer模型单向偏置、累计误差等问题,难以生成高保真视频;扩散模型具有很好的泛化性,但受制于推理速度和高昂的内存消耗,难以生成高清的长视频。然后,该文介绍了文本到视频生成领域的评测基准和指标,并分析比较了现有主流方法的性能。最后,展望了未来可能的研究方向。 展开更多
关键词 文本到视频生成 扩散模型 生成对抗网络
在线阅读 下载PDF
跨模态目标重识别研究综述
5
作者 崔振宇 周嘉欢 彭宇新 《计算机科学》 CSCD 北大核心 2024年第1期13-25,共13页
目标重识别(ReID)技术旨在匹配不同区域摄像头在不同时间拍摄到的同一目标,其核心是通过目标间的细粒度差异实现不同目标的有效区分。因此,目标重识别技术被广泛应用于安防布控、刑侦监控等领域并发挥了重要作用。传统的目标重识别技术... 目标重识别(ReID)技术旨在匹配不同区域摄像头在不同时间拍摄到的同一目标,其核心是通过目标间的细粒度差异实现不同目标的有效区分。因此,目标重识别技术被广泛应用于安防布控、刑侦监控等领域并发挥了重要作用。传统的目标重识别技术通常适用于光照条件良好情况下的可见光模态数据,但在处理黑夜低光照条件下的目标重识别任务时,其性能通常受到严重限制。红外摄像机因其卓越的夜视性能,通常被应用于在低光照条件下采集目标红外图像。因此,跨模态目标重识别技术旨在通过可见光图像匹配红外图像,实现全天候不间断的目标重识别。近年来,跨模态目标重识别技术取得了很大进展,然而,对于现有模型的归纳总结及深入分析仍然欠缺。为此,对跨模态目标重识别领域的相关研究和新颖方法进行了深入调研和总结,讨论了现有方法在实际场景中面临的挑战,并从模型分类和模型评价两个方面对现有方法进行归纳与分析。首先,围绕跨模态目标重识别问题的研究难点,将跨模态目标重识别分为生成式方法和非生成式方法两大类;然后,对当前跨模态重识别领域中广泛使用的评测数据集以及相关评价指标进行了综述与总结;最后,讨论了跨模态重识别领域仍然存在的挑战并对未来发展趋势进行了展望。 展开更多
关键词 计算机视觉 目标重识别 跨模态 细粒度特征 表征学习
在线阅读 下载PDF
陈堃銶:我有幸参与告别铅与火的印刷革命 被引量:1
6
作者 丛中笑 陈立翠 《科学通报》 北大核心 2025年第7期770-774,共5页
汉字激光照排系统是20世纪80年代开始推广应用的新技术.它的产业化和应用,废除了中国沿用数百年的铅字印刷,使中文印刷业告别了“铅与火”,大步跨进“光与电”的时代.陈堃銶,北京大学王选计算机研究所教授、博士生导师.1936年6月生, 195... 汉字激光照排系统是20世纪80年代开始推广应用的新技术.它的产业化和应用,废除了中国沿用数百年的铅字印刷,使中文印刷业告别了“铅与火”,大步跨进“光与电”的时代.陈堃銶,北京大学王选计算机研究所教授、博士生导师.1936年6月生, 1953~1957年就读于北京大学数学力学系,毕业后留校,在数学力学系计算数学教研室任教. 1975年起,与王选一道,开始从事我国“汉字信息处理系统工程”(简称“748工程”)中“汉字激光照排系统”的研究,是该系统大型软件的总负责人,承担了早期软件的全部设计并负责实现. 展开更多
关键词 汉字信息处理 大型软件 数学力学系 数学教研室 系统工程 陈堃 印刷业 博士生导师
原文传递
表格识别技术研究进展 被引量:21
7
作者 高良才 李一博 +6 位作者 都林 张新鹏 朱子仪 卢宁 金连文 黄永帅 汤帜 《中国图象图形学报》 CSCD 北大核心 2022年第6期1898-1917,共20页
表格广泛存在于科技文献、财务报表、报纸杂志等各类文档中,用于紧凑地存储和展现数据,蕴含着大量有用信息。表格识别是表格信息再利用的基础,具有重要的应用价值,也一直是模式识别领域的研究热点之一。随着深度学习的发展,针对表格识... 表格广泛存在于科技文献、财务报表、报纸杂志等各类文档中,用于紧凑地存储和展现数据,蕴含着大量有用信息。表格识别是表格信息再利用的基础,具有重要的应用价值,也一直是模式识别领域的研究热点之一。随着深度学习的发展,针对表格识别的新研究和新方法纷纷涌现。然而,由于表格应用场景广泛、样式众多、图像质量参差不齐等因素,表格识别领域仍然存在着大量问题亟需解决。为了更好地总结前人工作,为后续研究提供支持,本文围绕表格区域检测、结构识别和内容识别等3个表格识别子任务,从传统方法、深度学习方法等方面,综述该领域国内外的发展历史和最新进展。梳理了表格识别相关数据集及评测标准,并基于主流数据集和标准,分别对表格区域检测、结构识别、表格信息抽取的典型方法进行了性能比较。然后,对比分析了国内相对于国外,在表格识别方面的研究进展与水平。最后,结合表格识别领域目前面临的主要困难与挑战,对未来的研究趋势和技术发展目标进行了展望。 展开更多
关键词 表格区域检测 表格结构识别 表格内容识别 深度学习 单元格识别 表格信息抽取
原文传递
新时代科学家需要具备怎样的精神--论王选的成功因素 被引量:5
8
作者 丛中笑 《人民论坛》 CSSCI 北大核心 2020年第9期70-73,共4页
当前我国正在大力弘扬新时代科学家精神,通过多种方式和渠道大力表彰、宣传科技界的民族英雄和国家脊梁,进而为建设世界科技强国汇聚磅礴力量。作为新中国培养的科学大师,王选的科学家精神带有典范意义,值得深入挖掘总结。王选的人生经... 当前我国正在大力弘扬新时代科学家精神,通过多种方式和渠道大力表彰、宣传科技界的民族英雄和国家脊梁,进而为建设世界科技强国汇聚磅礴力量。作为新中国培养的科学大师,王选的科学家精神带有典范意义,值得深入挖掘总结。王选的人生经历和科研历程是探寻王选成功的内在关键因素,从中可以总结出独特的"王选精神",而这又可以与新时代科学家精神产生共鸣,对我国杰出科技人才的精神世界塑造意义重大。 展开更多
关键词 新时代科学家精神 王选 成功因素
在线阅读 下载PDF
王选的青年科技人才培养创新模式 被引量:3
9
作者 丛中笑 《学术前沿》 CSSCI 北大核心 2019年第19期92-99,共8页
北京大学王选院士是一位著名科学家,他带领科研团队研制的汉字信息处理与激光照排系统,引发了我国报业和印刷出版业的技术革命。王选也是一位教育家,他以提携后学为己任,在教学科研和产学研结合的实践中,积极探索,甘为人梯,培养了一批... 北京大学王选院士是一位著名科学家,他带领科研团队研制的汉字信息处理与激光照排系统,引发了我国报业和印刷出版业的技术革命。王选也是一位教育家,他以提携后学为己任,在教学科研和产学研结合的实践中,积极探索,甘为人梯,培养了一批优秀青年科技人才,形成了一套独特的人才培养创新模式。本文从识才、育才、用才、惜才等方面,系统研究和总结了王选的师德风范、教育思想和生动实践,对实施创新驱动发展战略和人才强国战略,培养德才兼备的创新型人才具有切实可行的示范作用和重要的现实意义。 展开更多
关键词 王选 创新模式 人才强国战略 汉字激光照排系统
在线阅读 下载PDF
王选:“当代毕昇”与文化自信 被引量:1
10
作者 丛中笑 《民主与科学》 2022年第5期8-14,共7页
习近平总书记多次强调,“文化自信,是更基础、更广泛、更深厚的自信,是更基本、更深沉、更持久的力量”“中国有坚定的道路自信、理论自信、制度自信,其本质是建立在5000多年文明传承基础上的文化自信。”[1]中华文明是世界上唯一发展... 习近平总书记多次强调,“文化自信,是更基础、更广泛、更深厚的自信,是更基本、更深沉、更持久的力量”“中国有坚定的道路自信、理论自信、制度自信,其本质是建立在5000多年文明传承基础上的文化自信。”[1]中华文明是世界上唯一发展至今没有中断的文明,是中华民族独特的精神标识,给我们的文化自信打下了最深厚的历史根基。 展开更多
关键词 文化自信 文明传承 历史根基 中华文明 道路自信 制度自信 理论自信 精神标识
在线阅读 下载PDF
王选的创新思想与实践对建设科技自立自强国家的启示
11
作者 丛中笑 《民主与科学》 2021年第6期3-6,共4页
王选是一位创新思想家,他站在国家战略层面对如何实现科教兴国、人才强国进行了深刻思考和总结,其独树一帜的创新理论,今天看来仍富有前瞻性和鲜活的可借鉴性,对当今发挥科技创新核心驱动力、建设科技自立自强国家具有十分宝贵的启迪和... 王选是一位创新思想家,他站在国家战略层面对如何实现科教兴国、人才强国进行了深刻思考和总结,其独树一帜的创新理论,今天看来仍富有前瞻性和鲜活的可借鉴性,对当今发挥科技创新核心驱动力、建设科技自立自强国家具有十分宝贵的启迪和示范意义。王选院士是享誉海内外的著名科学家。他带领科研团队紧跟我国科技体制改革的时代脚步,攻坚克难,大胆创新,研制成功汉字信息处理与激光照排系统,并实现成果市场化和产业化,掀起了我国"告别铅与火、迎来光与电"的印刷技术革命,为信息时代汉字和中华文化的传承与发展创造了条件。 展开更多
关键词 科技体制改革 大胆创新 科研团队 激光照排系统 汉字信息处理 自立自强 王选 印刷技术
在线阅读 下载PDF
基于HRED模型的中文多轮对话任务方法研究 被引量:7
12
作者 王孟宇 俞鼎耀 +2 位作者 严睿 胡文鹏 赵东岩 《中文信息学报》 CSCD 北大核心 2020年第8期78-85,共8页
多轮对话任务是自然语言处理中最具有实用价值的技术之一,该任务要求系统在产生通顺回答语句的同时能够照顾到上下文信息。近年来,出现了一大批以HRED(hierarchical recurrent encoder-decoder)模型为基础的多轮对话模型,其运用多层级... 多轮对话任务是自然语言处理中最具有实用价值的技术之一,该任务要求系统在产生通顺回答语句的同时能够照顾到上下文信息。近年来,出现了一大批以HRED(hierarchical recurrent encoder-decoder)模型为基础的多轮对话模型,其运用多层级的循环神经网络来编码上下文信息,并在Movie-DiC等英文对话数据集上取得了不错的结果。在2018年京东举办的中文多轮对话大赛中,京东向参赛选手公布了一批高质量的真实客服对话语料。该文在此数据上进行实验,针对HRED模型的缺点以及在中文语料下的表现进行改进,提出基于注意力和跨步融合机制与HRED模型结合的方案,实验结果表明,该方案取得了较大的性能提升。 展开更多
关键词 多轮对话 生成式模型 自然语言处理
在线阅读 下载PDF
时代楷模 创新典范——王选与我国第二次印刷技术革命
13
作者 丛中笑 《印刷工业》 2019年第5期34-35,共2页
王选曾经总结了汉字激光照排系统工程成功的5个原因,包括国家和部门的大力支持;用户的紧密配合;协作单位的共同努力;良好的科研风气;正确的技术决策。习近平总书记曾两次在讲话中提到汉字激光照排技术,一是2010年3月在俄罗斯"汉语... 王选曾经总结了汉字激光照排系统工程成功的5个原因,包括国家和部门的大力支持;用户的紧密配合;协作单位的共同努力;良好的科研风气;正确的技术决策。习近平总书记曾两次在讲话中提到汉字激光照排技术,一是2010年3月在俄罗斯"汉语年"开幕式上的致辞,他提及,文字的发明和发展对人类文明进步起到了巨大推动作用,汉字是中华文明的重要标志,也是传承中华文明的重要载体,上个世纪80年代汉字激光照排系统问世,使汉字焕发出新的生机和活力。 展开更多
关键词 协作单位 印刷技术 巨大推动作用 中华文明 重要载体 时代楷模 生机和活力 俄罗斯
在线阅读 下载PDF
摩尔纹图案自动去除技术综述 被引量:2
14
作者 亓文法 刘宇鑫 郭宗明 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期728-747,共20页
如今,数码相机和智能手机在人们的生活中扮演着越来越重要的角色,已经成为人们感知世界、记录信息和沟通交流的主要工具.当使用这些设备拍摄电子屏幕时,显示设备和摄像头传感器网格之间往往会发生混叠,通常导致图片中存在不规则分布的... 如今,数码相机和智能手机在人们的生活中扮演着越来越重要的角色,已经成为人们感知世界、记录信息和沟通交流的主要工具.当使用这些设备拍摄电子屏幕时,显示设备和摄像头传感器网格之间往往会发生混叠,通常导致图片中存在不规则分布的摩尔纹干扰图案,从而严重影响了拍摄图像的视觉质量效果.因此,摩尔纹图案去除方法研究对于拍摄图像的后期处理具有重要意义.为此,详细梳理了摩尔纹去除研究的发展脉络,并根据不同的适用场景和技术实现将现有方法分为2类:基于先验知识的摩尔纹去除方法和基于深度学习的摩尔纹去除方法.鉴于深度学习网络中训练数据集的收集和对齐方式不同,该类方法又分为基于卷积神经网络(CNN)的摩尔纹去除方法和基于生成式对抗网络(GAN)的摩尔纹去除方法.在此基础上,选择相同的公开数据集,对主流的深度学习方法进行算法实现和性能对比分析,并分别总结了各类方法的优缺点.最后,对未来的研究方向进行展望. 展开更多
关键词 摩尔纹图案 图像恢复 多尺度 深度学习 卷积神经网络 生成式对抗网络
在线阅读 下载PDF
基于感知和记忆的视频动态质量评价
15
作者 林丽群 暨书逸 +3 位作者 何嘉晨 赵铁松 陈炜玲 郭宗明 《电子学报》 EI CAS CSCD 北大核心 2024年第11期3727-3740,共14页
由于网络环境的多变性,视频播放过程中容易出现卡顿、比特率波动等情况,严重影响了终端用户的体验质量.为优化网络资源分配并提升用户观看体验,准确评估视频质量至关重要.现有的视频质量评价方法主要针对短视频,普遍关注人眼视觉感知特... 由于网络环境的多变性,视频播放过程中容易出现卡顿、比特率波动等情况,严重影响了终端用户的体验质量.为优化网络资源分配并提升用户观看体验,准确评估视频质量至关重要.现有的视频质量评价方法主要针对短视频,普遍关注人眼视觉感知特性,较少考虑人类记忆特性对视觉信息的存储和表达能力,以及视觉感知和记忆特性之间的相互作用.而用户观看长视频的时候,其质量评价需要动态评价,除了考虑感知要素外,还要引入记忆要素.为了更好地衡量长视频的质量评价,本文引入深度网络模型,深入探讨了视频感知和记忆特性对用户观看体验的影响,并基于两者特性提出长视频的动态质量评价模型.首先,本文设计主观实验,探究在不同视频播放模式下,视觉感知特性和人类记忆特性对用户体验质量的影响,构建了基于用户感知和记忆的视频质量数据库(Video Quality Database with Perception And Memory,PAM-VQD);其次,基于PAM-VQD数据库,采用深度学习的方法,结合视觉注意力机制,提取视频的深层感知特征,以精准评估感知对用户体验质量的影响;最后,将前端网络输出的感知质量分数、播放状态以及自卡顿间隔作为三个特征输入长短期记忆网络,以建立视觉感知和记忆特性之间的时间依赖关系.实验结果表明,所提出的质量评估模型在不同视频播放模式下均能准确预测用户体验质量,且泛化性能良好. 展开更多
关键词 视觉感知特性 记忆效应 体验质量 深度学习 注意力机制
在线阅读 下载PDF
一种高精度图像套准系统的设计与实现
16
作者 武博文 刘志红 樊浩力 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第2期145-152,共8页
在数字印后工艺生产中,介质传送误差常导致套准困难,通常需要对印刷品进行精确定位。目前,常用的定位方法是在印刷品空白处加入套印标识物,通过检测标识物进行定位。然而,这种方法在图像幅面占据整个印刷品幅面时无法使用。为了解决这... 在数字印后工艺生产中,介质传送误差常导致套准困难,通常需要对印刷品进行精确定位。目前,常用的定位方法是在印刷品空白处加入套印标识物,通过检测标识物进行定位。然而,这种方法在图像幅面占据整个印刷品幅面时无法使用。为了解决这一问题,本研究设计并实现了一套高精度智能图像套准系统,在保证图像采集与印刷的实时性与效率的同时,通过利用预先设计好的模板,在实时采集的图像中寻找匹配程度最高的区域,从而在印刷品中未加入套印标识的情况下,仍可实现印刷套准。印刷生产环境中实验结果表明,本方法的准确性和效率等均可满足实际工业生产的需求,具有较高的泛用性与实际的生产应用价值。 展开更多
关键词 数字印刷 数字印后增效 图像套准 无标记检测技术
在线阅读 下载PDF
参与“告别铅与火”的印刷革命
17
作者 陈堃銶 《印刷工业》 2024年第4期27-31,共5页
挤进“748”1974年,北京大学研制成6912计算机,校领导为了能使学校各部门采用计算机管理,于1975年初成立调查组。从调查中得知,国家有个“汉字信息处理系统工程”,是四机部、一机部、中国科学院、新华社、国家出版局联名于1974年8月向... 挤进“748”1974年,北京大学研制成6912计算机,校领导为了能使学校各部门采用计算机管理,于1975年初成立调查组。从调查中得知,国家有个“汉字信息处理系统工程”,是四机部、一机部、中国科学院、新华社、国家出版局联名于1974年8月向国家计委请示设立的,简称“748”工程。该工程设3个子项目:汉字通信、汉字情报检索和汉字精密照排。 展开更多
关键词 汉字信息处理 国家出版局 中国科学院 情报检索 国家计委 计算机管理 系统工程 北京大学
在线阅读 下载PDF
大模型时代的自然语言处理:挑战、机遇与发展 被引量:100
18
作者 车万翔 窦志成 +20 位作者 冯岩松 桂韬 韩先培 户保田 黄民烈 黄萱菁 刘康 刘挺 刘知远 秦兵 邱锡鹏 万小军 王宇轩 文继荣 严睿 张家俊 张民 张奇 赵军 赵鑫 赵妍妍 《中国科学:信息科学》 CSCD 北大核心 2023年第9期1645-1687,共43页
近期发布的ChatGPT和GPT-4等大型语言模型,不仅能高质量完成自然语言生成任务,生成流畅通顺,贴合人类需求的语言,而且具备以生成式框架完成各种开放域自然语言理解任务的能力.在少样本、零样本场景下,大模型可取得接近乃至达到传统监督... 近期发布的ChatGPT和GPT-4等大型语言模型,不仅能高质量完成自然语言生成任务,生成流畅通顺,贴合人类需求的语言,而且具备以生成式框架完成各种开放域自然语言理解任务的能力.在少样本、零样本场景下,大模型可取得接近乃至达到传统监督学习方法的性能,且具有较强的领域泛化性,从而对传统自然语言核心任务产生了巨大的冲击和影响.本文就大模型对自然语言处理的影响进行了详细的调研和分析,试图探究大模型对自然语言处理核心任务带来哪些挑战和机遇,探讨大模型将加强哪些自然语言处理共性问题的研究热度,展望大模型和自然语言处理技术的未来发展趋势和应用.分析结果表明,大模型时代的自然语言处理依然大有可为.我们不仅可以将大模型作为研究方法和手段,学习、借鉴大型语言模型的特点和优势,变革自然语言处理的主流研究范式,对分散独立的自然语言处理任务进行整合,进一步提升自然语言核心任务的能力;还可就可解释性、公平性、安全性、信息准确性等共性问题开展深入研究,促进大模型能力和服务质量的提升.未来,以大模型作为基座,拓展其感知、计算、推理、交互和控制能力,自然语言处理技术将进一步助力通用人工智能的发展,促进各行各业的生产力进步,更好地为人类社会服务. 展开更多
关键词 ChatGPT 对话式大模型 大型语言模型 自然语言处理 通用人工智能
原文传递
从ChatGPT到多模态大模型:现状与未来 被引量:33
19
作者 李耕 王梓烁 +1 位作者 何相腾 彭宇新 《中国科学基金》 CSSCI CSCD 北大核心 2023年第5期724-734,共11页
2022年底,OpenAI发布的ChatGPT聊天机器人将人工智能对通用自然语言任务的理解与生成能力提升到新的高度,引发各界广泛关注。当前ChatGPT仅支持文本模态的交互,而真实世界的感知则依赖于图像、文本、视频、音频等多个模态的协同处理。... 2022年底,OpenAI发布的ChatGPT聊天机器人将人工智能对通用自然语言任务的理解与生成能力提升到新的高度,引发各界广泛关注。当前ChatGPT仅支持文本模态的交互,而真实世界的感知则依赖于图像、文本、视频、音频等多个模态的协同处理。如何借鉴人脑的跨模态处理特性,跨越视觉、语言、听觉等不同感官信息实现对真实世界的感知和认知,是提升模型通用感知和交互能力、实现通用人工智能的关键。本文从ChatGPT的核心技术出发,分析ChatGPT在文本单模态限制下所面临的问题,并介绍ChatGPT与多模态分析技术结合的部分代表性工作,最后从多模态预训练、数据—知识双轮驱动等角度对ChatGPT多模态化的未来研究方向进行展望。 展开更多
关键词 ChatGPT 多模态分析 大语言模型 通用人工智能 多模态预训练
原文传递
技术驱动下数字出版及其专业建设 被引量:4
20
作者 高良才 贾爱霞 《中国出版》 CSSCI 北大核心 2022年第17期16-19,共4页
数字出版脱胎于传统出版,但数字出版的概念又不能仅仅局限于书报刊等传统出版物的出版,它的内涵在于知识和信息(即内容)基于互联网的数字化创作、生产、运营、传播、消费和监管。数字出版作为出版业重要板块及发展方向,其专业建设是建... 数字出版脱胎于传统出版,但数字出版的概念又不能仅仅局限于书报刊等传统出版物的出版,它的内涵在于知识和信息(即内容)基于互联网的数字化创作、生产、运营、传播、消费和监管。数字出版作为出版业重要板块及发展方向,其专业建设是建强出版学科、建设出版强国的内在要求。 展开更多
关键词 数字出版 传统出版物 出版强国 技术驱动 互联网 出版业 知识和信息 出版学科
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部