期刊导航
期刊开放获取
唐山市科学技术情报研究..
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
12
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
规模以下工业调查的若干问题研究
被引量:
8
1
作者
金勇进
姜天英
《统计研究》
CSSCI
北大核心
2019年第3期42-50,共9页
规模以下工业调查作为工业统计调查的重要组成部分,是收集规模以下工业数据的主要工具。自1996年试点调查以来,规模以下工业调查制度已经过多次调整,但仍有部分问题尚待解决。在系统梳理了规模以下工业调查发展历程的基础上,本文对我国...
规模以下工业调查作为工业统计调查的重要组成部分,是收集规模以下工业数据的主要工具。自1996年试点调查以来,规模以下工业调查制度已经过多次调整,但仍有部分问题尚待解决。在系统梳理了规模以下工业调查发展历程的基础上,本文对我国现行的抽样调查设计进行了详细总结;而后结合实地调研,从数据角度出发研究了规模以下工业调查存在的若干问题:抽样框问题、数据质量问题和工业统计规模划分问题。最后针对以上三大类问题提出了相对应的改进建议。
展开更多
关键词
规模以下工业抽样调查
抽样框
调查误差
地域抽样
工业规模划分标准
在线阅读
下载PDF
职称材料
规模以下工业抽样调查问题研究
2
作者
金勇进
姜天英
《统计理论与实践》
2020年第9期3-11,共9页
规模以下工业是工业生产活动的重要组成单位,对工业经济发展具有重大意义.本文首先对规模以下工业抽样调查进行了全面回顾,系统梳理了其发展历程和抽样调查设计方案,并总结了当前规模以下工业调查存在的三大问题院抽样框更新维护滞后尧...
规模以下工业是工业生产活动的重要组成单位,对工业经济发展具有重大意义.本文首先对规模以下工业抽样调查进行了全面回顾,系统梳理了其发展历程和抽样调查设计方案,并总结了当前规模以下工业调查存在的三大问题院抽样框更新维护滞后尧样本与总体存在差异尧存在调查误差.同时讨论了两个热点研究方向院工业规模划分标准和抽样框设计,最后总结了后续研究的重点.
展开更多
关键词
规模以下工业
工业规模划分标准
地域抽样框
在线阅读
下载PDF
职称材料
工业企业规模标准划分问题研究
被引量:
3
3
作者
金勇进
姜天英
《统计与信息论坛》
CSSCI
北大核心
2019年第7期3-9,共7页
现行的工业调查制度自2011年制定实施以来,距今已有7年之久。伴随着中国经济的快速发展,工业企业规模划分标准急需进行相应的调整。在工业企业规模标准划分的问题上,主要研究了两个问题:规模划分指标的选取和规模划分值的确定。以2016...
现行的工业调查制度自2011年制定实施以来,距今已有7年之久。伴随着中国经济的快速发展,工业企业规模划分标准急需进行相应的调整。在工业企业规模标准划分的问题上,主要研究了两个问题:规模划分指标的选取和规模划分值的确定。以2016年湖北省工业企业数据为例,选取年主营业务收入和从业人数作为备选指标,通过运用边际理论、样本量与抽样误差的关系、离散系数以及指标增速等测算方法,可将规模划分标准设定为年主营业务收入1亿元或从业人数80人,且从业人数比年主营业务收入更具稳定性。工业企业规模划分标准的适当提高,有利于对规模以上工业企业数据进行全面核实审查,提高数据质量;同时,也有利于充分发挥规模以下工业企业抽样调查的作用。
展开更多
关键词
工业企业
规模划分标准
规模划分指标
年主营业务收入
从业人数
规模划分值
在线阅读
下载PDF
职称材料
不可忽略的无回答机制下的校准研究
被引量:
2
4
作者
金勇进
刘晓宇
《统计与信息论坛》
CSSCI
北大核心
2020年第8期3-10,共8页
在实际调查工作中,由于客观条件的限制,难以完全避免无回答情况的出现。当无回答已经产生,且单元作答情况与目标变量本身有关系时,缺失数据机制不可忽略,需要在数据分析阶段弥补无回答对估计产生的负面影响。现有方法多假定缺失数据机...
在实际调查工作中,由于客观条件的限制,难以完全避免无回答情况的出现。当无回答已经产生,且单元作答情况与目标变量本身有关系时,缺失数据机制不可忽略,需要在数据分析阶段弥补无回答对估计产生的负面影响。现有方法多假定缺失数据机制为随机缺失,少数非随机缺失机制下的方法基于模型进行推断,但因其对模型假设和模型识别的较强要求造成了应用上的局限性。校准估计已在抽样推断中得到了广泛应用,它在利用辅助信息提高样本代表性的同时,控制了无回答误差。采用RGRG法将模型校准法与准随机化的响应模型相结合,解决非随机缺失下的权数调整和总体估计问题。对RGRG法的估计过程和估计优势进行了理论分析和实证研究。结果表明,在不可忽略的无回答机制下,通过RGRG法的调整降低了最终权数的变异性;加权估计量具有更小的偏差、标准误差和均方误差根,具有渐进无偏性和渐近一致性。同时,该方法是稳健的,对无回答具有双重保护作用,允许响应模型和超总体模型仅在一定程度上拟合总体,降低了对模型识别的敏感度。
展开更多
关键词
非随机缺失
不可忽略的无回答机制
校准法
响应模型
在线阅读
下载PDF
职称材料
脱贫攻坚抽样设计中的若干问题研究
被引量:
1
5
作者
金勇进
刘晓宇
《统计理论与实践》
2021年第11期8-13,共6页
“现行标准下的农村贫困人口实现脱贫,贫困县全部摘帽,解决区域性整体贫困”是我国“十三五”规划的重要要求。为科学严谨地评价脱贫攻坚的成果,根据《中共中央国务院关于打赢脱贫攻坚战三年行动的指导意见》的部署,我国已于2021年2月...
“现行标准下的农村贫困人口实现脱贫,贫困县全部摘帽,解决区域性整体贫困”是我国“十三五”规划的重要要求。为科学严谨地评价脱贫攻坚的成果,根据《中共中央国务院关于打赢脱贫攻坚战三年行动的指导意见》的部署,我国已于2021年2月如期完成脱贫攻坚普查。为进一步确保结论的准确性,在对国家贫困县建档立卡户进行普查的基础上,对非国家贫困县的建档立卡户进行抽样调查。本文总结了设计方案时存在的现实挑战,并以此为基础,对现行抽样方案进行详细分析:从方案的设计思路到权数的调整与评估,再到估计量的计算与误差分析,旨在从专业角度讨论该调查设计的科学性,为后续数据分析提供参考。
展开更多
关键词
脱贫攻坚
抽样设计
权数调整
参数估计
在线阅读
下载PDF
职称材料
权数对基于模型推断的影响分析
被引量:
8
6
作者
金勇进
刘晓宇
《统计与信息论坛》
CSSCI
北大核心
2022年第3期3-13,共11页
利用抽样调查数据对总体参数进行推断通常分为两种途径:一种是基于设计的推断体系;另一种是基于模型的推断体系。基于设计的推断以随机化理论为基础,推断依赖于抽样设计,在大样本下估计量具有无偏性和一致性,但在样本量较小或存在非抽...
利用抽样调查数据对总体参数进行推断通常分为两种途径:一种是基于设计的推断体系;另一种是基于模型的推断体系。基于设计的推断以随机化理论为基础,推断依赖于抽样设计,在大样本下估计量具有无偏性和一致性,但在样本量较小或存在非抽样误差等情况下效率较低。基于模型的推断认为有限总体是一个来自无限超总体的随机样本,推断依赖于模型假设,构建超总体模型具有很大的灵活性,有利于充分利用总体辅助信息并提高估计精度,但在模型假定有误或样本的入样过程不具有无信息性时存在估计误差。如何将两种推断途径相结合,在体现样本对总体代表性的同时,保证估计效率和估计量的优良性质,尚待研究。权数在基于设计的推断中起着核心作用,能够反映抽样设计对样本的影响,实现样本对总体的还原。将权数引入基于模型的推断,可以使基于模型推断的结果具有总体代表性,能更好地发挥两种推断体系的组合优势,并削弱模型假定对推断效果的影响。据此,从权数对于模型推断的影响入手,针对因果推断问题,提出将权数同时引入倾向得分模型和预测模型的建模过程,来构造双稳健估计的方法,并通过模拟研究加以验证。最终结果表明,根据文章所提出的方法进行处理效应的估计,能够充分发挥权数的作用,得到更准确、更稳健的估计结果。实证部分采用2017年CGSS调查数据进行分析,进一步说明在基于调查数据进行模型推断时应充分考虑抽样设计的影响,为科研人员进行因果推断以及其他基于调查数据开展的研究提供参考。
展开更多
关键词
权数
基于模型的推断
因果推断
双稳健估计
在线阅读
下载PDF
职称材料
规模以下工业地域抽样的可行性研究
被引量:
6
7
作者
金勇进
姜天英
《数理统计与管理》
CSSCI
北大核心
2020年第5期865-873,共9页
现行规模以下工业中的目录企业调查是按照目录企业抽样框采用一阶段分层随机抽样抽取样本.但随着经济的高速发展,市场中企业新增和消亡变动频繁,导致目录企业抽样框的不稳定性,从而在一定程度上降低了目录企业的估计精度.而相比下,以村...
现行规模以下工业中的目录企业调查是按照目录企业抽样框采用一阶段分层随机抽样抽取样本.但随着经济的高速发展,市场中企业新增和消亡变动频繁,导致目录企业抽样框的不稳定性,从而在一定程度上降低了目录企业的估计精度.而相比下,以村(居委会)为抽样单元的地域抽样框的稳定性较高,因此本文提出使用地域抽样进行规模以下工业企业调查的设想,基于湖北省的调查数据,从方差公式出发测算了四个影响因素:总体群数、样本群数、样本量分配方式以及分层变量的可行性;并进一步提出使用一套地域样本的MPPS抽样方法同时进行规模以下工业企业和个体工业单位的调查思路,最终得出使用地域抽样进行规模以下工业调查具有可实施性.
展开更多
关键词
规模以下工业
地域抽样
MPPS抽样
原文传递
大数据背景下的抽样调查
被引量:
4
8
作者
金勇进
刘晓宇
《系统科学与数学》
CSCD
北大核心
2022年第1期2-16,共15页
大数据具有体量大、种类丰富、增长速度快等特点,同时也存在价值密度低、代表性差等问题,为抽样调查带来了机遇与挑战.大数据背景下的抽样如何适应新的变化、具有怎样的发展和应用?文章从三个角度进行了讨论.一是在数据流环境下产生了...
大数据具有体量大、种类丰富、增长速度快等特点,同时也存在价值密度低、代表性差等问题,为抽样调查带来了机遇与挑战.大数据背景下的抽样如何适应新的变化、具有怎样的发展和应用?文章从三个角度进行了讨论.一是在数据流环境下产生了一些适应性强的新型抽样方法,能够高效、准确地获得有代表性样本,并兼顾存储空间、处理的时间与能力.二是借助网络开展调查或进行社交网络数据的收集,发展出一些无抽样框的非概率抽样方法,能够以低廉的成本在短时间内获得大量分析样本.三是综合大数据与抽样调查的优势,进行线上、线下调查数据的融合,文章针对线上样本是非概率样本、线下样本是概率样本的情况,提出了融合的基本思路:一方面,通过概率样本对非概率样本进行``概率性检验'',另一方面,通过提取概率样本的信息,基于模型或基于伪随机化对总体进行推断.
展开更多
关键词
大数据
抽样调查
数据流
非概率抽样
数据融合
原文传递
基于DCSBM模型的受访者驱动抽样调查估计量改进
被引量:
1
9
作者
蒋妍
孟珠峰
+1 位作者
王天佳
刘晓宇
《系统科学与数学》
CSCD
北大核心
2022年第1期85-99,共15页
大数据背景下,将受访者驱动抽样(RDS)用于网络抽样调查,解决了传统抽样调查难以获得可用抽样框、难以接触被调查者以及难以获得回答等问题,也使得网络调查可以实现概率抽样,得到一定误差范围内的总体参数估计.然而,在实际抽样过程中,同...
大数据背景下,将受访者驱动抽样(RDS)用于网络抽样调查,解决了传统抽样调查难以获得可用抽样框、难以接触被调查者以及难以获得回答等问题,也使得网络调查可以实现概率抽样,得到一定误差范围内的总体参数估计.然而,在实际抽样过程中,同质性问题(即样本单元在推荐同伴时倾向于推荐那些与自己有相同属性的同伴)会导致RDS估计量的方差增大.为解决该问题,文章假定目标总体服从度修正随机块模型(DCSBM),利用区块间的经验转移概率对样本进行区块的事后分层,提出了事后分层与逆概率加权相结合的PS-IPW估计量.通过模拟不同的同质性水平的目标总体社交网络和RDS抽样,比较PS-IPW估计量的相对效率;并通过实证分析,利用样本分块矩阵的谱性质选择分层变量,进一步验证RDS抽样的适用性以及PS-IPW估计量的有效性.
展开更多
关键词
受访者驱动抽样
度修正随机块模型
同质性
PS-IPW估计量
原文传递
基于抽样权数调整的非参数分层贝叶斯模型小域估计方法研究
10
作者
刘晓宇
蒋妍
《系统科学与数学》
CSCD
北大核心
2023年第12期3312-3323,共12页
对于大型抽样调查的子总体估计需求,在划分全国样本后,经常存在子总体内部样本分布不均匀,样本量无法满足估计精度要求的问题,常用的HT估计量根据包含概率倒数加权,效果受样本量制约,尤其无法实现对样本量为0的域的估计;基于模型的小域...
对于大型抽样调查的子总体估计需求,在划分全国样本后,经常存在子总体内部样本分布不均匀,样本量无法满足估计精度要求的问题,常用的HT估计量根据包含概率倒数加权,效果受样本量制约,尤其无法实现对样本量为0的域的估计;基于模型的小域估计方法不依赖抽样设计,能借助辅助信息和其它域信息对小样本和无样本域进行一定精度下的估计,但选用参数模型存在模型假定失效的可能,据此,文章将非参数方法引入分层贝叶斯小域估计模型,以避免对总体和模型作过多假设、增强模型的适用范围,并结合抽样设计,将抽样机制引入估计过程作进一步拓展,使文章方法适用于各类复杂抽样:对于非参数分层贝叶斯模型,在基于一阶随机游走模型的高斯过程和基于B样条基函数的惩罚样条两种具体平滑函数下,提出了抽样权数调整基于模型小域估计的具体方式,并基于某地区第四次全国经济普查微观数据进行实证.
展开更多
关键词
小域估计
分层贝叶斯模型
抽样机制
随机游走
惩罚样条
原文传递
非概率样本的模型推断
被引量:
6
11
作者
金勇进
郝一炜
《数学的实践与认识》
北大核心
2019年第5期246-255,共10页
非概率抽样在大数据时代有广阔的应用空间,但其统计推断问题仍有待研究和发展.针对这一问题,提出利用基于模型的推断方法结合配额抽样实现非概率样本的统计推断,其思路是先设定线性回归形式的超总体模型,再利用配额样本观测数据拟合模...
非概率抽样在大数据时代有广阔的应用空间,但其统计推断问题仍有待研究和发展.针对这一问题,提出利用基于模型的推断方法结合配额抽样实现非概率样本的统计推断,其思路是先设定线性回归形式的超总体模型,再利用配额样本观测数据拟合模型估计未知参数,进而利用模型对非观测单元进行预测,案例分析结果显示基于超总体模型的推断方法是解决非概率样本统计推断的有力途径,具有较大的深入研究价值.
展开更多
关键词
非概率抽样
配额抽样
基于模型的抽样推断
无信息抽样
原文传递
老字号时尚化的逻辑困境:艺术、性别和正念
被引量:
3
12
作者
张会锋
蒋妍
《清华管理评论》
2019年第7期96-103,共8页
老字号经营哲学和现代时尚的逻辑冲突。现代时尚与艺术合流并且符号化、女性化转向,秉承我国传统文化的老字号则形成了实用性的、男性化的认识论,从而与前者背离。引入组织正念理论,其开放接纳的、去自动化的认识论,可以帮助老字号统合...
老字号经营哲学和现代时尚的逻辑冲突。现代时尚与艺术合流并且符号化、女性化转向,秉承我国传统文化的老字号则形成了实用性的、男性化的认识论,从而与前者背离。引入组织正念理论,其开放接纳的、去自动化的认识论,可以帮助老字号统合上述冲突,重建时尚创新逻辑。
展开更多
关键词
逻辑困境
时尚化
老字号
艺术
性别
经营哲学
传统文化
创新逻辑
原文传递
题名
规模以下工业调查的若干问题研究
被引量:
8
1
作者
金勇进
姜天英
机构
中国人民大学
统计学院
教育部重点
研究
基地"应用统计科学
研究
中心"
中国人民大学调查技术研究所
出处
《统计研究》
CSSCI
北大核心
2019年第3期42-50,共9页
基金
国家社会科学基金项目"大数据背景下非概率抽样的统计推断问题研究"(15BTJ014)
中国人民大学"中央高校建设世界一流大学(学科)和特色发展引导专项资金"
中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目"规模以下工业企业抽样框问题研究"(18XNH090)的资助
文摘
规模以下工业调查作为工业统计调查的重要组成部分,是收集规模以下工业数据的主要工具。自1996年试点调查以来,规模以下工业调查制度已经过多次调整,但仍有部分问题尚待解决。在系统梳理了规模以下工业调查发展历程的基础上,本文对我国现行的抽样调查设计进行了详细总结;而后结合实地调研,从数据角度出发研究了规模以下工业调查存在的若干问题:抽样框问题、数据质量问题和工业统计规模划分问题。最后针对以上三大类问题提出了相对应的改进建议。
关键词
规模以下工业抽样调查
抽样框
调查误差
地域抽样
工业规模划分标准
Keywords
Industrial Sample Survey under a Designated Size
Sampling Frame
Survey Error
Area Sampling
Standards for Categorizing Industrial Sizes
分类号
C811 [社会学—统计学]
在线阅读
下载PDF
职称材料
题名
规模以下工业抽样调查问题研究
2
作者
金勇进
姜天英
机构
中国人民大学
统计学院
中国人民大学调查技术研究所
湖北经济学院
出处
《统计理论与实践》
2020年第9期3-11,共9页
基金
中国人民大学“中央高校建设世界一流大学(学科)和特色发展引导专项资金”资助。
文摘
规模以下工业是工业生产活动的重要组成单位,对工业经济发展具有重大意义.本文首先对规模以下工业抽样调查进行了全面回顾,系统梳理了其发展历程和抽样调查设计方案,并总结了当前规模以下工业调查存在的三大问题院抽样框更新维护滞后尧样本与总体存在差异尧存在调查误差.同时讨论了两个热点研究方向院工业规模划分标准和抽样框设计,最后总结了后续研究的重点.
关键词
规模以下工业
工业规模划分标准
地域抽样框
分类号
C811 [社会学—统计学]
在线阅读
下载PDF
职称材料
题名
工业企业规模标准划分问题研究
被引量:
3
3
作者
金勇进
姜天英
机构
中国人民大学
应用统计科学
研究
中心
中国人民大学
统计学院
中国人民大学调查技术研究所
出处
《统计与信息论坛》
CSSCI
北大核心
2019年第7期3-9,共7页
基金
中国人民大学“中央高校建设世界一流大学(学科)和特色发展引导专项资金”
文摘
现行的工业调查制度自2011年制定实施以来,距今已有7年之久。伴随着中国经济的快速发展,工业企业规模划分标准急需进行相应的调整。在工业企业规模标准划分的问题上,主要研究了两个问题:规模划分指标的选取和规模划分值的确定。以2016年湖北省工业企业数据为例,选取年主营业务收入和从业人数作为备选指标,通过运用边际理论、样本量与抽样误差的关系、离散系数以及指标增速等测算方法,可将规模划分标准设定为年主营业务收入1亿元或从业人数80人,且从业人数比年主营业务收入更具稳定性。工业企业规模划分标准的适当提高,有利于对规模以上工业企业数据进行全面核实审查,提高数据质量;同时,也有利于充分发挥规模以下工业企业抽样调查的作用。
关键词
工业企业
规模划分标准
规模划分指标
年主营业务收入
从业人数
规模划分值
Keywords
industrial enterprises
scale division criteria
scale division index
the main business incomes
the number of employees
optimal value
分类号
C811 [社会学—统计学]
在线阅读
下载PDF
职称材料
题名
不可忽略的无回答机制下的校准研究
被引量:
2
4
作者
金勇进
刘晓宇
机构
中国人民大学
应用统计科学
研究
中心
中国人民大学
统计学院
中国人民大学调查技术研究所
出处
《统计与信息论坛》
CSSCI
北大核心
2020年第8期3-10,共8页
文摘
在实际调查工作中,由于客观条件的限制,难以完全避免无回答情况的出现。当无回答已经产生,且单元作答情况与目标变量本身有关系时,缺失数据机制不可忽略,需要在数据分析阶段弥补无回答对估计产生的负面影响。现有方法多假定缺失数据机制为随机缺失,少数非随机缺失机制下的方法基于模型进行推断,但因其对模型假设和模型识别的较强要求造成了应用上的局限性。校准估计已在抽样推断中得到了广泛应用,它在利用辅助信息提高样本代表性的同时,控制了无回答误差。采用RGRG法将模型校准法与准随机化的响应模型相结合,解决非随机缺失下的权数调整和总体估计问题。对RGRG法的估计过程和估计优势进行了理论分析和实证研究。结果表明,在不可忽略的无回答机制下,通过RGRG法的调整降低了最终权数的变异性;加权估计量具有更小的偏差、标准误差和均方误差根,具有渐进无偏性和渐近一致性。同时,该方法是稳健的,对无回答具有双重保护作用,允许响应模型和超总体模型仅在一定程度上拟合总体,降低了对模型识别的敏感度。
关键词
非随机缺失
不可忽略的无回答机制
校准法
响应模型
Keywords
non-random missing
nonignorable nonresponse mechanism
calibration
response model
分类号
C81 [社会学—统计学]
在线阅读
下载PDF
职称材料
题名
脱贫攻坚抽样设计中的若干问题研究
被引量:
1
5
作者
金勇进
刘晓宇
机构
中国人民大学
应用统计科学
研究
中心
中国人民大学
统计学院
中国人民大学调查技术研究所
出处
《统计理论与实践》
2021年第11期8-13,共6页
文摘
“现行标准下的农村贫困人口实现脱贫,贫困县全部摘帽,解决区域性整体贫困”是我国“十三五”规划的重要要求。为科学严谨地评价脱贫攻坚的成果,根据《中共中央国务院关于打赢脱贫攻坚战三年行动的指导意见》的部署,我国已于2021年2月如期完成脱贫攻坚普查。为进一步确保结论的准确性,在对国家贫困县建档立卡户进行普查的基础上,对非国家贫困县的建档立卡户进行抽样调查。本文总结了设计方案时存在的现实挑战,并以此为基础,对现行抽样方案进行详细分析:从方案的设计思路到权数的调整与评估,再到估计量的计算与误差分析,旨在从专业角度讨论该调查设计的科学性,为后续数据分析提供参考。
关键词
脱贫攻坚
抽样设计
权数调整
参数估计
分类号
C811 [社会学—统计学]
在线阅读
下载PDF
职称材料
题名
权数对基于模型推断的影响分析
被引量:
8
6
作者
金勇进
刘晓宇
机构
中国人民大学
应用统计科学
研究
中心
中国人民大学
统计学院
中国人民大学调查技术研究所
出处
《统计与信息论坛》
CSSCI
北大核心
2022年第3期3-13,共11页
基金
全国统计科学研究重点项目“大型抽样调查样本整合及其有效性研究”(2020LZ27)。
文摘
利用抽样调查数据对总体参数进行推断通常分为两种途径:一种是基于设计的推断体系;另一种是基于模型的推断体系。基于设计的推断以随机化理论为基础,推断依赖于抽样设计,在大样本下估计量具有无偏性和一致性,但在样本量较小或存在非抽样误差等情况下效率较低。基于模型的推断认为有限总体是一个来自无限超总体的随机样本,推断依赖于模型假设,构建超总体模型具有很大的灵活性,有利于充分利用总体辅助信息并提高估计精度,但在模型假定有误或样本的入样过程不具有无信息性时存在估计误差。如何将两种推断途径相结合,在体现样本对总体代表性的同时,保证估计效率和估计量的优良性质,尚待研究。权数在基于设计的推断中起着核心作用,能够反映抽样设计对样本的影响,实现样本对总体的还原。将权数引入基于模型的推断,可以使基于模型推断的结果具有总体代表性,能更好地发挥两种推断体系的组合优势,并削弱模型假定对推断效果的影响。据此,从权数对于模型推断的影响入手,针对因果推断问题,提出将权数同时引入倾向得分模型和预测模型的建模过程,来构造双稳健估计的方法,并通过模拟研究加以验证。最终结果表明,根据文章所提出的方法进行处理效应的估计,能够充分发挥权数的作用,得到更准确、更稳健的估计结果。实证部分采用2017年CGSS调查数据进行分析,进一步说明在基于调查数据进行模型推断时应充分考虑抽样设计的影响,为科研人员进行因果推断以及其他基于调查数据开展的研究提供参考。
关键词
权数
基于模型的推断
因果推断
双稳健估计
Keywords
weights
model-based inference
causal inference
double-robust estimation
分类号
C81 [社会学—统计学]
在线阅读
下载PDF
职称材料
题名
规模以下工业地域抽样的可行性研究
被引量:
6
7
作者
金勇进
姜天英
机构
中国人民大学
应用统计科学
研究
中心
中国人民大学
统计学院
中国人民大学调查技术研究所
出处
《数理统计与管理》
CSSCI
北大核心
2020年第5期865-873,共9页
基金
中国人民大学“中央高校建设世界一流大学(学科)和特色发展引导专项资金”资助。
文摘
现行规模以下工业中的目录企业调查是按照目录企业抽样框采用一阶段分层随机抽样抽取样本.但随着经济的高速发展,市场中企业新增和消亡变动频繁,导致目录企业抽样框的不稳定性,从而在一定程度上降低了目录企业的估计精度.而相比下,以村(居委会)为抽样单元的地域抽样框的稳定性较高,因此本文提出使用地域抽样进行规模以下工业企业调查的设想,基于湖北省的调查数据,从方差公式出发测算了四个影响因素:总体群数、样本群数、样本量分配方式以及分层变量的可行性;并进一步提出使用一套地域样本的MPPS抽样方法同时进行规模以下工业企业和个体工业单位的调查思路,最终得出使用地域抽样进行规模以下工业调查具有可实施性.
关键词
规模以下工业
地域抽样
MPPS抽样
Keywords
industrial survey under the designated size
regional sampling
MPPS
分类号
C811 [社会学—统计学]
O212 [理学—概率论与数理统计]
原文传递
题名
大数据背景下的抽样调查
被引量:
4
8
作者
金勇进
刘晓宇
机构
中国人民大学
应用统计科学
研究
中心
中国人民大学
统计学院
中国人民大学调查技术研究所
出处
《系统科学与数学》
CSCD
北大核心
2022年第1期2-16,共15页
文摘
大数据具有体量大、种类丰富、增长速度快等特点,同时也存在价值密度低、代表性差等问题,为抽样调查带来了机遇与挑战.大数据背景下的抽样如何适应新的变化、具有怎样的发展和应用?文章从三个角度进行了讨论.一是在数据流环境下产生了一些适应性强的新型抽样方法,能够高效、准确地获得有代表性样本,并兼顾存储空间、处理的时间与能力.二是借助网络开展调查或进行社交网络数据的收集,发展出一些无抽样框的非概率抽样方法,能够以低廉的成本在短时间内获得大量分析样本.三是综合大数据与抽样调查的优势,进行线上、线下调查数据的融合,文章针对线上样本是非概率样本、线下样本是概率样本的情况,提出了融合的基本思路:一方面,通过概率样本对非概率样本进行``概率性检验'',另一方面,通过提取概率样本的信息,基于模型或基于伪随机化对总体进行推断.
关键词
大数据
抽样调查
数据流
非概率抽样
数据融合
Keywords
Big data
sampling survey
data stream
non-probability sampling
data integration
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
O212.2 [理学—概率论与数理统计]
原文传递
题名
基于DCSBM模型的受访者驱动抽样调查估计量改进
被引量:
1
9
作者
蒋妍
孟珠峰
王天佳
刘晓宇
机构
中国人民大学
应用统计科学
研究
中心
中国人民大学
统计学院
中国人民大学调查技术研究所
出处
《系统科学与数学》
CSCD
北大核心
2022年第1期85-99,共15页
基金
教育部哲学社会科学研究重大课题攻关项目(20JZD023)资助课题。
文摘
大数据背景下,将受访者驱动抽样(RDS)用于网络抽样调查,解决了传统抽样调查难以获得可用抽样框、难以接触被调查者以及难以获得回答等问题,也使得网络调查可以实现概率抽样,得到一定误差范围内的总体参数估计.然而,在实际抽样过程中,同质性问题(即样本单元在推荐同伴时倾向于推荐那些与自己有相同属性的同伴)会导致RDS估计量的方差增大.为解决该问题,文章假定目标总体服从度修正随机块模型(DCSBM),利用区块间的经验转移概率对样本进行区块的事后分层,提出了事后分层与逆概率加权相结合的PS-IPW估计量.通过模拟不同的同质性水平的目标总体社交网络和RDS抽样,比较PS-IPW估计量的相对效率;并通过实证分析,利用样本分块矩阵的谱性质选择分层变量,进一步验证RDS抽样的适用性以及PS-IPW估计量的有效性.
关键词
受访者驱动抽样
度修正随机块模型
同质性
PS-IPW估计量
Keywords
Respondent driven sampling
degree modified random block model
homogeneity
PS-IPW
分类号
O212.2 [理学—概率论与数理统计]
原文传递
题名
基于抽样权数调整的非参数分层贝叶斯模型小域估计方法研究
10
作者
刘晓宇
蒋妍
机构
首都经济贸易
大学
统计学院
中国人民大学
应用统计科学
研究
中心
中国人民大学
统计学院
中国人民大学调查技术研究所
出处
《系统科学与数学》
CSCD
北大核心
2023年第12期3312-3323,共12页
基金
国家社会科学基金青年项目(23CTJ027)资助课题.
文摘
对于大型抽样调查的子总体估计需求,在划分全国样本后,经常存在子总体内部样本分布不均匀,样本量无法满足估计精度要求的问题,常用的HT估计量根据包含概率倒数加权,效果受样本量制约,尤其无法实现对样本量为0的域的估计;基于模型的小域估计方法不依赖抽样设计,能借助辅助信息和其它域信息对小样本和无样本域进行一定精度下的估计,但选用参数模型存在模型假定失效的可能,据此,文章将非参数方法引入分层贝叶斯小域估计模型,以避免对总体和模型作过多假设、增强模型的适用范围,并结合抽样设计,将抽样机制引入估计过程作进一步拓展,使文章方法适用于各类复杂抽样:对于非参数分层贝叶斯模型,在基于一阶随机游走模型的高斯过程和基于B样条基函数的惩罚样条两种具体平滑函数下,提出了抽样权数调整基于模型小域估计的具体方式,并基于某地区第四次全国经济普查微观数据进行实证.
关键词
小域估计
分层贝叶斯模型
抽样机制
随机游走
惩罚样条
Keywords
Small area estimation
hierarchical Bayesian model
sampling mechanism
random walk model
penalized splines
分类号
O212.1 [理学—概率论与数理统计]
原文传递
题名
非概率样本的模型推断
被引量:
6
11
作者
金勇进
郝一炜
机构
中国人民大学
应用统计科学
研究
中心
中国人民大学
统计学院
中国人民大学调查技术研究所
首都医科
大学
附属北京地坛医院
出处
《数学的实践与认识》
北大核心
2019年第5期246-255,共10页
基金
国家社科基金项目<大数据背景下非概率抽样的统计推断问题研究>(15BTJ014)
中央高校建设世界一流大学(学科)和特色发展引导专项基金
文摘
非概率抽样在大数据时代有广阔的应用空间,但其统计推断问题仍有待研究和发展.针对这一问题,提出利用基于模型的推断方法结合配额抽样实现非概率样本的统计推断,其思路是先设定线性回归形式的超总体模型,再利用配额样本观测数据拟合模型估计未知参数,进而利用模型对非观测单元进行预测,案例分析结果显示基于超总体模型的推断方法是解决非概率样本统计推断的有力途径,具有较大的深入研究价值.
关键词
非概率抽样
配额抽样
基于模型的抽样推断
无信息抽样
Keywords
non-probability sampling
quota sampling
model-based survey sampling
non-informative sampling
分类号
O212.2 [理学—概率论与数理统计]
原文传递
题名
老字号时尚化的逻辑困境:艺术、性别和正念
被引量:
3
12
作者
张会锋
蒋妍
机构
河南工程学院工商管理学院
中国人民大学
统计学院
中国人民大学调查技术研究所
出处
《清华管理评论》
2019年第7期96-103,共8页
基金
国家社科基金:“中国老字号时尚化的机理、路径及对策研究”(17BGL092)赞助
文摘
老字号经营哲学和现代时尚的逻辑冲突。现代时尚与艺术合流并且符号化、女性化转向,秉承我国传统文化的老字号则形成了实用性的、男性化的认识论,从而与前者背离。引入组织正念理论,其开放接纳的、去自动化的认识论,可以帮助老字号统合上述冲突,重建时尚创新逻辑。
关键词
逻辑困境
时尚化
老字号
艺术
性别
经营哲学
传统文化
创新逻辑
分类号
F273.2 [经济管理—企业管理]
原文传递
题名
作者
出处
发文年
被引量
操作
1
规模以下工业调查的若干问题研究
金勇进
姜天英
《统计研究》
CSSCI
北大核心
2019
8
在线阅读
下载PDF
职称材料
2
规模以下工业抽样调查问题研究
金勇进
姜天英
《统计理论与实践》
2020
0
在线阅读
下载PDF
职称材料
3
工业企业规模标准划分问题研究
金勇进
姜天英
《统计与信息论坛》
CSSCI
北大核心
2019
3
在线阅读
下载PDF
职称材料
4
不可忽略的无回答机制下的校准研究
金勇进
刘晓宇
《统计与信息论坛》
CSSCI
北大核心
2020
2
在线阅读
下载PDF
职称材料
5
脱贫攻坚抽样设计中的若干问题研究
金勇进
刘晓宇
《统计理论与实践》
2021
1
在线阅读
下载PDF
职称材料
6
权数对基于模型推断的影响分析
金勇进
刘晓宇
《统计与信息论坛》
CSSCI
北大核心
2022
8
在线阅读
下载PDF
职称材料
7
规模以下工业地域抽样的可行性研究
金勇进
姜天英
《数理统计与管理》
CSSCI
北大核心
2020
6
原文传递
8
大数据背景下的抽样调查
金勇进
刘晓宇
《系统科学与数学》
CSCD
北大核心
2022
4
原文传递
9
基于DCSBM模型的受访者驱动抽样调查估计量改进
蒋妍
孟珠峰
王天佳
刘晓宇
《系统科学与数学》
CSCD
北大核心
2022
1
原文传递
10
基于抽样权数调整的非参数分层贝叶斯模型小域估计方法研究
刘晓宇
蒋妍
《系统科学与数学》
CSCD
北大核心
2023
0
原文传递
11
非概率样本的模型推断
金勇进
郝一炜
《数学的实践与认识》
北大核心
2019
6
原文传递
12
老字号时尚化的逻辑困境:艺术、性别和正念
张会锋
蒋妍
《清华管理评论》
2019
3
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部