期刊文献+
共找到205篇文章
< 1 2 11 >
每页显示 20 50 100
基于少量标注数据的半监督K-means算法 被引量:1
1
作者 曹奇敏 刘鸿霞 《电脑编程技巧与维护》 2017年第13期40-42,共3页
为了获得充足的训练语料,提出了半监督的K-means算法(SSK-means),算法的运行过程中不再随机选择初始中心点,而是先从各类标注数据分别选取一个作为初始中心点,其余的则从未标注数据中选择,选择距离已选初始点较远的数据,这就保证初始点... 为了获得充足的训练语料,提出了半监督的K-means算法(SSK-means),算法的运行过程中不再随机选择初始中心点,而是先从各类标注数据分别选取一个作为初始中心点,其余的则从未标注数据中选择,选择距离已选初始点较远的数据,这就保证初始点不会属于同一类,从而使得标注的结果具有较高的准确率。实验结果表明,SSK-means算法是有效的,它具有较好的性能。 展开更多
关键词 半监督K-means算法 文本分类 初始聚类中心 标注数据
在线阅读 下载PDF
基于弱标注数据的汉语分词领域移植 被引量:2
2
作者 朱运 李正华 +1 位作者 黄德朋 张民 《中文信息学报》 CSCD 北大核心 2019年第9期1-8,共8页
近年来,基于神经网络的分词模型在封闭领域文本上取得了很高的性能。然而,在领域移植场景下,即测试数据与训练数据的领域差异较大时,分词的性能会显著下降。该文尝试利用自动获取的弱标注数据来提升领域移植场景下的分词性能。首先,对... 近年来,基于神经网络的分词模型在封闭领域文本上取得了很高的性能。然而,在领域移植场景下,即测试数据与训练数据的领域差异较大时,分词的性能会显著下降。该文尝试利用自动获取的弱标注数据来提升领域移植场景下的分词性能。首先,对目前性能最好的BiLSTM-CRF分词模型进行扩展,引入适用于弱标注数据的损失函数;进而提出一种简单有效的数据筛选方法,从海量弱标注数据中筛选和目前领域更相关的数据;最后,该文发现数据预处理和在神经网络中引入传统特征均可以有效提高分词性能。在SIGHAN Bakeoff 2010和ZhuXian标注测试集上的实验结果表明,该文所提方法可有效提升汉语分词领域移植性能,平均F值提高了3.6%。 展开更多
关键词 汉语分词 领域移植 标注数据
在线阅读 下载PDF
基于生成对抗网络的自动装卸目标物标注数据集生成方法 被引量:2
3
作者 卢国杰 王桂棠 +2 位作者 陈泳铮 甘仕文 林宗杰 《电子测量技术》 北大核心 2022年第17期86-93,共8页
针对建立无人起重装卸目标检测深度学习标注数据耗时问题,设计了货物图像检测生成对抗网络,构成准确的含语义标注和关键点标注的数据集,该数据集可用于有监督深度学习语义分割模型的训练。通过融合StyleGAN与DatasetGAN的生成对抗网络,... 针对建立无人起重装卸目标检测深度学习标注数据耗时问题,设计了货物图像检测生成对抗网络,构成准确的含语义标注和关键点标注的数据集,该数据集可用于有监督深度学习语义分割模型的训练。通过融合StyleGAN与DatasetGAN的生成对抗网络,对实际应用中存在的语义特征变形问题进行改进,将生成器的样本归一化层进行修改,去除均值操作,修改噪声模块和样式控制因子的输入方式;对纹理特征单一的物体的空间位置编码能力弱的问题,将生成网络的常数输入替换为傅里叶特征,并提出一个融合非线性上下采样的模块;最后引入WGAN-GP对目标函数进行改进。应用实验生成标签数据集,使用Deeplab-V3作为评价网络,以DatasetGAN方法作为基线,在语义标签生成任务上,Deeplab-V3输出mIOU值提高14.83%,在关键点标签生成任务上,L2损失平均降低0.4×10^(-4),PCK值平均提高5.06%,验证了改进的生成对抗网络生成语义及关键点标注数据的可行性和先进性。 展开更多
关键词 生成对抗网络 标注数据生成 DatasetGAN 起重装卸
在线阅读 下载PDF
AutoCAD支持下的公差检索与标注数据库 被引量:1
4
作者 胡亚平 张芹 《机械与电子》 1995年第6期14-15,共2页
以dBASE构造符合国家标准的公差数据库、在AutoCAD环境下利用该数据库对机械图的尺寸公差和形位公差的公差值和图形符号实现自动检索与标注。
关键词 机械制图 CAD 公差检索 标注数据
在线阅读 下载PDF
支撑数据标注产业发展
5
作者 曾建勋 《农业图书情报学报》 2025年第1期100-101,共2页
2024年12月26日,国家发展改革委、国家数据局、财政部及人力资源社会保障部联合发布《关于促进数据标注产业高质量发展的实施意见》明确提出,到2027年,数据标注产业的专业化、智能化及科技创新能力将显著提升,产业规模大幅跃升,年均复... 2024年12月26日,国家发展改革委、国家数据局、财政部及人力资源社会保障部联合发布《关于促进数据标注产业高质量发展的实施意见》明确提出,到2027年,数据标注产业的专业化、智能化及科技创新能力将显著提升,产业规模大幅跃升,年均复合增长率超过20%。 展开更多
关键词 实施意见 数据标注 专业化 智能化 产业发展
在线阅读 下载PDF
国家发展改革委等部门关于促进数据标注产业高质量发展的实施意见
6
《中小企业管理与科技》 2025年第1期1-3,共3页
数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业。培育壮大数据标注产业对于提升数据供给质量,推动人工智能创新发展具有重要支撑作用。为促进数据标注产业高质量发展,现提出以下意见。
关键词 数据标注 人工智能 国家发展改革委 新兴产业 质量检验 加工处理 支撑作用
在线阅读 下载PDF
2024智能数据标注行业纵览
7
作者 开门与关门 《互联网周刊》 2025年第1期34-34,共1页
数据标注作为一种新兴的生产力引擎,正发挥着越来越重要的作用。它不仅是人工智能发展的基石,更是推动社会经济进步的重要力量。数据标注,简而言之,就是对原始数据进行加工处理,为其赋予特定的意义或标签,以便机器能够识别和学习。在数... 数据标注作为一种新兴的生产力引擎,正发挥着越来越重要的作用。它不仅是人工智能发展的基石,更是推动社会经济进步的重要力量。数据标注,简而言之,就是对原始数据进行加工处理,为其赋予特定的意义或标签,以便机器能够识别和学习。在数字时代,数据是新的石油,而数据标注则是提炼这些石油的关键工序。无论是图像识别、语音识别,还是自然语言处理,都离不开高质量的数据标注工作。可以说,没有数据标注,就没有人工智能的快速发展。 展开更多
关键词 自然语言处理 人工智能 数据标注 图像识别 语音识别 关键工序 数字时代 加工处理
在线阅读 下载PDF
面向人工智能的传统音乐标注数据集构建研究——兼论多模态胡琴标注数据集的建设与应用 被引量:1
8
作者 张宇 孙茂松 《中央音乐学院学报》 CSSCI 北大核心 2024年第2期66-83,共18页
当前人工智能在音乐方面的研究和应用主要集中在西方古典音乐和流行音乐等领域。以世界各地的传统音乐为对象的相关研究仍然处于初级阶段,其中一个主要原因是缺乏高质量的数据集和标注规范。文章从数据的内容、标注和应用等方面,探讨了... 当前人工智能在音乐方面的研究和应用主要集中在西方古典音乐和流行音乐等领域。以世界各地的传统音乐为对象的相关研究仍然处于初级阶段,其中一个主要原因是缺乏高质量的数据集和标注规范。文章从数据的内容、标注和应用等方面,探讨了传统音乐标注数据集的发展现状。基于对当前研究的深入分析,文章提出了面向人工智能的音乐标注数据集的构建原则,并针对传统音乐的特点加以阐述。在此基础上,以第一个中国胡琴音乐标注数据集(CCOM-HuQin)为例介绍了数据集在人工智能领域的研究成果和应用前景。文章强调了人工智能应用于传统音乐的意义不仅在于辅助创作和表演,更是为了促进传统音乐的保护、传承和发展。 展开更多
关键词 人工智能 标注数据 音乐信息检索 传统音乐 胡琴
原文传递
数据标注治理:可信人工智能的后台风险与治理转向
9
作者 胡泳 张文杰 《云南社会科学》 CSSCI 北大核心 2024年第6期29-36,共8页
在人工智能模型训练前,须先对数据进行人工识别与标注,因此处于“后台”的数据标注成为引致人工智能“前台”幻觉与偏见风险的重要环节。近年来,隐蔽于人工智能后台的数据标注劳动者随着政策文件、媒体报道和调查报告的公布而逐渐浮现,... 在人工智能模型训练前,须先对数据进行人工识别与标注,因此处于“后台”的数据标注成为引致人工智能“前台”幻觉与偏见风险的重要环节。近年来,隐蔽于人工智能后台的数据标注劳动者随着政策文件、媒体报道和调查报告的公布而逐渐浮现,进一步推动学界警惕与反思技术革新的神秘化倾向。然而,从风险治理的角度来看,参与数据标注实践的多元主体仍然处于权责模糊的灰色地带,阻碍了可信人工智能目标的实现。全球主要经济体的数据标注治理路线显示,当前针对数据标注的治理对象以“人工智能服务提供者”为主,且倾向于将数据置于私人个体秩序中。通往可信人工智能的风险治理亟须将治理范围从“提供者”拓展至“数据供应链”,建设一种多元主体共同参与的集体性治理制度,进而更为细致地关照人工智能生产中的相关群体利益,为不稳定的数据劳动者提供具体的社会保障。 展开更多
关键词 数据标注 数据治理 幻觉 偏见 幽灵工作
在线阅读 下载PDF
可见、遮蔽与调适:“幽灵劳工”的社会技术想象及其纠偏——以数据标注员为例
10
作者 郑素侠 张莹 《新媒体与网络》 2024年第3期1-12,共12页
伴随人工智能的深度应用,技术与劳动的结合更加紧密,辅助技术介入劳动已经成为当下劳动市场的重要变革。作为智能技术系统中的“幽灵劳工”,数据标注员在社会技术想象中逐渐“被看见”。对微博平台“数据标注员”话题下的原创发帖分析发... 伴随人工智能的深度应用,技术与劳动的结合更加紧密,辅助技术介入劳动已经成为当下劳动市场的重要变革。作为智能技术系统中的“幽灵劳工”,数据标注员在社会技术想象中逐渐“被看见”。对微博平台“数据标注员”话题下的原创发帖分析发现,社会行动者从待遇、身份、未来三个层面建构了标注员的职业想象,赋予该职业以积极意义。深度访谈发现,数据标注员在劳动场域中受到线上流水线工作模式、系统算法控制和劳动分层的影响;面对想象与现实间的偏差,数据标注员通过再技能化、去平台化与个体脱域三种策略完成对主流社会想象的自我纠偏。 展开更多
关键词 人工智能 “幽灵劳工” 社会技术想象 数据标注
在线阅读 下载PDF
基于成对关系的埋点数据可视化标注系统 被引量:1
11
作者 孙嘉顺 翁罗轩 +4 位作者 刘实 沈健 潘启灏 张子麟 陈为 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2024年第4期472-482,共11页
埋点技术,即利用应用程序中嵌入的特殊代码收集运行过程中的数据,方便开发者分析和评估性能。多维埋点数据通常借助评估模型进行自动化分析,以减轻人工负担。然而,埋点数据标注作为训练模型的重要环节,仍存在难度大、效率低的问题。设... 埋点技术,即利用应用程序中嵌入的特殊代码收集运行过程中的数据,方便开发者分析和评估性能。多维埋点数据通常借助评估模型进行自动化分析,以减轻人工负担。然而,埋点数据标注作为训练模型的重要环节,仍存在难度大、效率低的问题。设计了一种基于成对关系的埋点数据标注方法,实现了一个交互式可视化标注系统,有效降低了埋点数据的标注难度,减轻了标注负担,并显著提升了标注效率。通过基于真实数据的案例分析和用户实验,验证了方法和系统的有效性和实用性。 展开更多
关键词 埋点数据 交互式 可视分析 数据标注 成对关系
在线阅读 下载PDF
建设文献情报领域的数据标注基地 被引量:1
12
作者 曾建勋 《农业图书情报学报》 2024年第4期102-103,共2页
2024年4月1日全国数据工作会议提出开展数据标注基地试点,从技术创新、行业赋能、生态培育、标准应用、人才就业、数据安全等6个方面探索建设国家级数据标注基地,并发布了承担数据标注基地建设任务的城市名单,预示着数据标注工作将在数... 2024年4月1日全国数据工作会议提出开展数据标注基地试点,从技术创新、行业赋能、生态培育、标准应用、人才就业、数据安全等6个方面探索建设国家级数据标注基地,并发布了承担数据标注基地建设任务的城市名单,预示着数据标注工作将在数据资源汇聚、数据质量提升、数据要素价值盘活中发挥重要作用。长期以来文献情报领域利用元数据、分类法、主词表、名称规范档等进行主题、分类和命名实体的著录、编目、标引和识别,以提升信息检索、知识发现、主聚类和情报分析的性能和效率。 展开更多
关键词 情报分析 文献情报 信息检索 数据标注 数据资源 数据 数据安全 标引
在线阅读 下载PDF
钢板表面缺陷图像增强与自动标注方法研究
13
作者 杨璐雅 黄新波 +1 位作者 任玉成 韩琪 《机械科学与技术》 北大核心 2025年第3期445-452,共8页
数据标注为机器学习提供了大量带标签的数据,在数据集制作时需要借助各种标注工具手动对图像进行画框标注,受主观因素影响较大,且工业现场环境复杂,采集到的图像质量不稳定,也会影响标注效果。因此提出一种改进MSR(Multi-scale retinex... 数据标注为机器学习提供了大量带标签的数据,在数据集制作时需要借助各种标注工具手动对图像进行画框标注,受主观因素影响较大,且工业现场环境复杂,采集到的图像质量不稳定,也会影响标注效果。因此提出一种改进MSR(Multi-scale retinex)钢板缺陷图像数据集增强算法和基于图像分块和像素差分的自适应目标框标注算法,首先在MSR基础上提出一种自适应权值计算方法对采集到的缺陷图像进行增强,通过计算信息熵占比自动确定权值Wk,克服了传统MSR算法需要人工调整权值的缺点;然后为了解决直接对整幅图像提取目标边界计算量太大的问题,提出一种分块计算像素差分的方法,分别计算每个子块图像的均值矩阵和2阶差分矩阵,通过判别目标在各个子块的分布情况,选取合适的子块分别计算矩形框的4个边界,代替人工画框辅助数据集的标注,并采用Faster R-CNN和YOLOv5进行缺陷检测验证。结果表明:提出算法的平均IoU为0.87,平均检测时间为457 ms,在公开数据集上的平均IoU和检测时间分别为0.84和473 ms,性能均优于其他方法,基于提出算法Faster R-CNN和YOLOv5的检测准确率分别提升了4.8%和5.9%,可以为深度学习模型提供质量稳定的数据集。 展开更多
关键词 数据标注 深度学习 数据集增强 像素2阶差分 自适应目标框标注
在线阅读 下载PDF
算法-关系-中介:平台劳动过程的混合控制框架搭建——基于AI数据标注员的扎根研究
14
作者 陆高峰 姚智宇 《现代传播(中国传媒大学学报)》 CSSCI 北大核心 2024年第8期38-47,共10页
在平台基础设施化背景下,“与数智技术同行”已然成为一种普遍的劳动方式。作为平台劳动者的人工智能数据标注员,是AI的“老师”,也是AI产业的“赛博螺丝工人”,在技术与人力的双重控制下,数据标注员的劳动过程经历了风险转嫁与权力失... 在平台基础设施化背景下,“与数智技术同行”已然成为一种普遍的劳动方式。作为平台劳动者的人工智能数据标注员,是AI的“老师”,也是AI产业的“赛博螺丝工人”,在技术与人力的双重控制下,数据标注员的劳动过程经历了风险转嫁与权力失衡的再中介化控制、标准化输出与价值异化的认知控制、时间操控与奖惩管理的数值控制。这三种控制机制缠绕作用,呈现出混合控制的现象。据此,“混合控制框架”整合了技术(算法)控制与社会(管理人员和中介机构)控制,通过区分平台技术执行的算法控制层、管理人员施加的关系控制层、层层外包后出现的中介控制层,阐释了“人-技”交织下平台劳动控制的多维复杂性。 展开更多
关键词 人工智能 数据标注 劳动过程 混合控制框架 平台经济
在线阅读 下载PDF
提升数据价值:质量控制在数据标注过程的应用与优化
15
作者 王峰 张天意 +2 位作者 朱方昊 王坤鑫 蔡韵音 《中国标准化》 2024年第21期267-271,共5页
数据质量是数据分析和应用的基石,而良好的质量控制方法是连接数据质量与数据分析应用效能的桥梁与纽带。为研究质量控制在标注过程中的应用与优化方法,以提高流程标准化水平,本文从质量控制的角度出发,分析当前数据标注过程中数据质量... 数据质量是数据分析和应用的基石,而良好的质量控制方法是连接数据质量与数据分析应用效能的桥梁与纽带。为研究质量控制在标注过程中的应用与优化方法,以提高流程标准化水平,本文从质量控制的角度出发,分析当前数据标注过程中数据质量可能存在的问题,通过评估体系建设、调整组织结构框架、项目制度建设、实施半自动化标注流程等方法应对当前质量控制存在的风险与挑战。最后,对数据标注过程中质量控制未来可能的发展态势进行总结,为提高团队应对数据质量风险的能力、支持业务决策提供支撑。 展开更多
关键词 质量控制 数据质量 数据标注 半自动 应用
在线阅读 下载PDF
欧美通过数据标注创新强化工业AI优势对我国的启示
16
作者 王瑞莹 《新经济导刊》 2024年第11期82-88,共7页
工业领域数据标注能够为人工智能模型训练提供高质量数据集,是保障智能制造系统性能的关键基础。在全球范围内,数据标注正广泛应用于制造行业和相关场景。欧美等国为适应工业数据特性、应对工业环境和场景需求、提升标注质量和专业性,... 工业领域数据标注能够为人工智能模型训练提供高质量数据集,是保障智能制造系统性能的关键基础。在全球范围内,数据标注正广泛应用于制造行业和相关场景。欧美等国为适应工业数据特性、应对工业环境和场景需求、提升标注质量和专业性,实现了标注技术、方法和管理的创新突破,进一步强化了欧美工业人工智能领先优势。我国应加快构建工业领域数据标注体系,通过推进工业数据标注技术与应用研究,研制工业数据标注标准,布局建设工业数据标注基地,推动工业数据标注资源流通共享,增强我国工业人工智能创新基础和发展动力。 展开更多
关键词 工业人工智能 工业数据标注
在线阅读 下载PDF
数据标注在智能家居领域的应用研究
17
作者 李坤 温锦辉 +2 位作者 张懿 田立勤 栾尚敏 《微型电脑应用》 2024年第3期23-25,共3页
将数据标注运用到智能家居系统中,通过摄像头、传感器等设备采集图片、视频、文本、语音数据,标注场景有面部识别、家具的标记、语音采集、人脸关键信息点提取、突发事件采集等。通过数据标注技术对人的行为、表情、言语进行识别,主要使... 将数据标注运用到智能家居系统中,通过摄像头、传感器等设备采集图片、视频、文本、语音数据,标注场景有面部识别、家具的标记、语音采集、人脸关键信息点提取、突发事件采集等。通过数据标注技术对人的行为、表情、言语进行识别,主要使用ImageNet数据集、Youtube-8M数据集、Yelp数据集、LibriSpeech数据集等分别作为图像、视频、文本和语音标注的标注数据数据集。对图像标注方法进行改善,通过图像标注对居民的安全处境、情绪状态等做出相应识别处理,从而解决家庭里的各种问题。 展开更多
关键词 数据标注 智能家居 信息点提取 安全
在线阅读 下载PDF
人工智能产业中数据标注众包劳动的法律检视——基于国内典型平台的分析
18
作者 魏凤 徐钰涵 +1 位作者 张天启 王澈 《社会科学前沿》 2024年第6期332-337,共6页
随着人工智能产业的高速发展,数据标注众包劳动成为平台零工经济下新的密集型就业途径,但这一业态也成为法律规制的薄弱地带。立足于国家人工智能发展战略,通过对典型数据标注平台的追踪调研,总结其众包劳动的运行模式并进行实效评估,... 随着人工智能产业的高速发展,数据标注众包劳动成为平台零工经济下新的密集型就业途径,但这一业态也成为法律规制的薄弱地带。立足于国家人工智能发展战略,通过对典型数据标注平台的追踪调研,总结其众包劳动的运行模式并进行实效评估,在检视问题与完善策略的基础上,提出细化的体系架构,形成工作派单、风险评估和劳动奖励的内部循环系统,并通过保护、促进和规划的方式形成外部运行机制,最终促进人工智能产业健康发展。 展开更多
关键词 人工智能 数据标注 众包劳动 劳动关系
在线阅读 下载PDF
数据标注技术在人工智能领域的研究和应用
19
作者 王峰 张天意 +2 位作者 朱方昊 王坤鑫 蔡韵音 《信息技术与标准化》 2024年第12期22-26,共5页
围绕数据标注技术,对数据标注行业现状、特点及其在人工智能大模型中的应用场景进行研究,总结数据标注技术的主要类型及面临的挑战,结合案例进一步验证自动化数据标注技术在人工智能模型中的实际应用及成效,对未来的技术发展趋势进行展望。
关键词 数据标注 人工智能 大模型 模型算法
在线阅读 下载PDF
基于规则引擎与数据标注技术的自动站历史数据整编与分析
20
作者 孙伟忠 刘明团 +2 位作者 熊梓立 黄华栋 张志坚 《气象水文海洋仪器》 2024年第6期39-41,46,共4页
文章针对目前广州自动气象站存在历史数据不完整的问题,基于规则引擎与数据标注技术,设计了通过配置检验指标定义检验规则、动态构建数据检验任务、对历史数据进行质量分析标注的方法,对2000—2022年广州市自动气象站分钟数据完整性进... 文章针对目前广州自动气象站存在历史数据不完整的问题,基于规则引擎与数据标注技术,设计了通过配置检验指标定义检验规则、动态构建数据检验任务、对历史数据进行质量分析标注的方法,对2000—2022年广州市自动气象站分钟数据完整性进行整编,并分析了二十多年自动气象站历史数据的完整性及规律,旨在增强历史数据的可用性及使用的便利性。 展开更多
关键词 自动气象站 历史数据 规则引擎 数据标注技术 完整性 统计分析
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部