• 站内
  • 站群
  • 图片
  • 视频
  • 文件
  • 互动
  • 服务
  • 国家数据

劳动力调查制度研究

发布机构:湖南省统计局 发布时间:2004-06-22 打印本页 | 字体大小:
    人是社会经济活动的主题,能够从事劳动的人口是经济发展的基本要素。以人为本的宏观管理,必须了解和掌握劳动力资源。中国在步入市场经济的过程中,同样不可避免地遇到了困扰工业化社会问题--失业难题。世界各国的政府、企业和科学研究机构经常搜集人口的劳动资源统计资料来预计经济循环变动,劳动统计成了现代国家经济管理中的一个重要组成部分。

    目前中国失业现象已普遍存在,并且成为影响社会稳定与经济发展的一个非常不利的因素,但长期以来,我国这方面未引起足够重视,导致国家失业统计纪录的真空。直到1993年有关统计部门才将原来所谓的"待业人员"改称为"失业人员",这虽然是一个历史性的进步,但在失业统计的理论方法以及具体操作环节上却没有多大改进。例如:《中国统计年鉴》中公布的失业率一直维持在2%一3%的低水平上,按照20世纪如年代以来西方经济理论所规定的5.5%一6%的自然失业率的标准衡量,中国应一直处于"超"充分就业状态。现行统计方法所提供的数字严重低估了中国的真实失业率。本文将对劳动力资源、劳动力失业情况、劳动时间及工资等几个方面的情况作一个介绍并深入探讨和研究。

    (一)我国劳动力失业统计现状及问题
    1.1:劳动资源统计。
    一个国家的劳动资源在一定程度上决定着该国物质产品的生产和提供服务的规模,劳动资源状况及其变动直接影响到劳动力市场的供求和劳动工资率。劳动资源由劳动力和"不在劳动力中"的人口构成,两部分的比例关系反映劳动资源的利用情况。

    ·劳动力资源量
    劳动力资源量是在劳动年龄界限内,具有劳动能力的人口总体。它表明一个国家或地区劳动力资源的规模和水平。我国劳动年龄界限是:男16-59岁、女16-54岁。在劳动年龄界限内的人口总体,是计算劳动力资源量的主要依据,但劳动年龄人口要受人口自然变动与机械变动的影响。在劳动年龄人口中,有一部分人因病、伤等原因丧失了劳动能力。也有一些虽在劳动年龄界限外(不足或超过)却从事社会劳动并取得报酬的人。此外,有些工种退休年龄还有具体规定,如井下、高空、高温、强体力劳动者退休年龄为:男55岁、女45岁。所有以上各种因素,在统计劳动力资源量时都应考虑进去予以调整。

    1.2:劳动力失业情况统计。
     随着经济体制改革的深化,失业在我国已成为一种普遍的社会现象和突出的社会矛盾,并成为影响社会稳定和经济发展的一个重要原因。我国失业统计所显示的失业率却一直保持在2%一3%的低水平上,这不仅直接影响到现实失业统计的可信度和对失业问题的深入研究,而且影响到政府对我国失业状况的宏观调控,要有效地缓解失业压力,必须首先实现对失业的科学统计。

    ·失业人口数
    失业人口数的经济意义在于反映某一时点上劳动力的利用情况,为判断宏观经济运行情况和制定宏观经济政策提供总量数字依据。该指标的统计采取住户(调查时点、调查区域的所有常住户和暂住户)抽样调查方式。在每年的1月底和7月底.两次以随机抽样方式在所有住户中确定受调查的住户,前半年每月末按1月确定的住户跟踪调查.后半年每月末按7月确定的住户跟踪调查,以保证资料的连续性和代表性。判定失业的标准:

    第一,以所调查住户劳动力每月的最后一整周是否从事有报酬工作一小时,作为判定失业和就业的临界点。凡有报酬工作不足一小时者视为失业。

    第二,农业劳动力及其家属每月末虽后一整周农业劳动不足15小时者视同失业。
   
    第三.兼业农民在调查周内从事农业劳动者,以第二条为判定标准,否则,以第一条为判定标准。   

    第四,伤病休息、临时休假和休养、临时脱产或半脱产学习人员视同就业。

    第五,领取退休金,从事住房租赁、资产及使用权投资等获取收入的人员,只要不符合上述第一或第二条规定者,仍视为失业。   

    第六,在押犯人、军人、学生和丧失劳动能力的病残人员不属于失业统计的范围。

    对季(或年)平均失业人数,按照下式计算:
    某季(半年、年)度平均失业人数=本季[年)每月调查周失业人数之和/K
    K为月数,季度取值3,半年度取值6,年度取值12
    对失业人口效的统计还需按照以下标志分组:

    第一,按性别分组统计,以反映因自然和社会的原因,男、女劳动力失业的情况;
    第二,按年龄分组统计,拟将年龄分为4档:
    18-24岁  此年龄段劳动力多屑初次求职者,且劳动技能及经验等较欠缺;   
    25-44岁  此年龄段的劳动力具备某方面的劳动技能,工作经验较丰富;   
    45-54岁  此年龄段的劳动力工作经验相当丰富,但身体素质处于逐渐下降阶段,
    55岁及以上  此年龄段的劳动力体力及脑力大幅度下降。

    ·显性失业
    凡同时具备下述三项条件的劳动适龄人口被视为显性失业人员:(1)在调查前四周没有工作或劳动时间在1小时之内;(2)愿意工作,采取了一定寻找工作的方式并付诸具体寻找工作行动;(3)如果有就业机会,在调查周内将可以应聘。我国显性失业人员主要来自:社会每年新增劳动力、下岗职工和农村剩余劳动力。按国内学者对中国农村劳动力剩余率所做的估计推算,目前我国农村约1.4亿剩余劳动力,显性失业无疑是失业统计的主要对象。

    ·隐性失业
    凡具备下述条件之一的劳动适龄人口视为隐性失业人员:(1)在业但边际劳动生产率为零或负值的劳动者;(2)满足显性失业定义的第二、三条,但在调查前四周劳动时间不足1小时且收入不能达到维持基本生活水准的人员。    我国隐性失业人口主要来自于社会每年新增劳动力、企事业单位冗员约占企事业人员40%左右和农村剩余劳动力。随着社会保障制度的健全,社会新增劳动力的隐性失业将逐渐显性化,到2010年企事业中冗员的隐性失业将全面显性化,农村剩余劳动力将在5年全面释放出来,即隐性失业人口比重将逐步缩小,显性失业人口将逐渐增大,随市场体制完善,我国的失业问题将成为纯粹的显性失业问题。据资料分析,我国目前的失业率为20-25%,失业情况属"严重失业国家"。

    (二)我国劳动力失业统计现状及问题
    2.1 我国劳动力统计存在的问题
    在高度集中的计划经济体制下,我国在城镇劳动就业领域实行的是统包统配的就业政策,每年将大批新成长的劳动力统统强制安排列国有单位或集体企业,失业问题被低效率的生产组织所掩盖,当时失业统计只统计"城镇待业"者的人数及比重。1980年,我国实行了新的就业方针,即实行在国家统筹规划下、劳动部门介绍就业,自愿组织起来就业和自谋职业相结合的就业方针,但"统包统配"劳动力仍占相当大的比重。在1993年,《中国统计年鉴》中将"城镇待业"指标改称"城镇失业",失业统计指标的含义及统计方法并无实质性的突化。

    我国失业统计存在的问题在于:
    (一)我国失业统计概念与国外存在较大差异不利于国际间的比较。
我国政府部门所统计的失业人口,通常是指那些在一定劳动年龄以内(16岁以上及男50岁以下,女45岁以下),有劳动能力,无业而要求就业,并在当地就业服务机构进行求职登记的人员。目前国际上通行的失业统计的概念基本上遵照1982年第十三届国际劳工统计大会通过的关于经济活动人口、就业、失业,就业不足统计的决议执行的,按照这个决议中对失业人员的统计定义,失业人员是指在一定年龄以上,在规定的调查时间范围内没有职业或工作时间没有达到规定标准,有劳动能力,正在寻找有报酬工作的人。对以上定义中可见,我国和国外在失业统计概念上的差异主要表现在以下几个方面:

    1、 统计标准不同
    从国际劳工组织关于失业人员的定义中可见,判断一个人是否失业是以"在规定的调查时间范围内工作时间没有达到规定标准"即"劳动事实"作为统计标准,而不管他是否进行了失业登记。至于工作时间,各国现定不一样,例如美国规定在调查周内工作15小时以上,法国规定每周工作20小时以上即算就业.否则就算失业。在我国的劳动统计中,对一个人在一定时期内从事劳动的时间标准缺乏明确的界定,一个人是否失业并不是以"劳动事实"为依据,而是以"是否登记"作为标准,很显然,其结果必然导致失业统计数据的失真。按"是否登记"作为失业标准,就排斥了以下几种情况:①未申报失业而实际无工作的失业人员;②有的人虽然在就业服务机构逆行了求职登记,但在失业期间仍从事一些零星工作.如做临时工,无证摊贩等,这些"失业人员"其实并非真正失业。

    2、 年龄界限不同
    国际劳工组织对失业者的定义只规定年龄下限,井无年龄上限规定,退休以后继续寻找工作者仍算失业者。我国对城镇失业人口统计的年龄是男36-50岁,女16-45岁,对失业者年龄的上限和下限都作了明确规定,而我国职工退休年龄一般为男60岁,女55岁,这样,就使得男51-60岁,女46-55岁的失业者得不到统计,从而产生遗漏。

    3、 统计口径不同
    一个国家的劳动力不但包括城镇劳动力,而且也应包括农村劳动力。国外统计的失业人数是包括城镇和农村的全部失业人口数,而我国失业的统计口径只限制在城镇居民中,不包括农村劳动人口中的失业人数,而我国农村劳动力人数要数倍于城镇劳动力人数,而且农村失业人口远远高于城镇失业人口。按国内学者对农村剩余劳动力所做估计推算,1996年,我国约有农村剩余劳动力(失业人口)1.4亿左右,而同期城镇登记失业人数仅为520万人,前者为后者的27倍,政府统计的失业人数就远远低于实际存在的失业人口规模。

     (二)我国现行的失业统计指标只能反映显性失业水平,无法反映隐性失业问题。
    国内学术界多数学者认为,失业有显性(公开)失业和隐性(非公开)失业之分。显性失业人口是指在一定时间内没有工作或劳动时间为零小时的不在业劳动适龄人口,但不包括那些现在不想工作者和那些虽想工作但末积极寻找工作者,加在校学生,伤病残疾者,临P、f脱产或半脱产者等等。隐性失业则是相对于显性失业而言的,隐性失业人口是指企业边际劳动生产率为零或负值的那部分劳动者。由于体制的原因、我国国型企事业单位沉淀了大量的富余人员,这部分富余人员是我国城镇隐性失业的主要人群。据估计,目前我国隐性失业的比重占职工总量的28%,是1996年显性失业人数的近5-6倍。可见,我国目前面临的主要问题不是显性失业,而是隐性失业,但到目前为止,我国的失业统计指标(如城镇登记失业率)只能反映显性失业水平,反映隐性失业现象的统计指标至今还没有建立起来。

    (三)现行失业统计调查方法简单.搜集来的数据准确性不高,时效性差。
    目前,我国失业统计资料搜集有两个渠道:一是把在各地方政府劳动管理部门登记的失业人数加以汇总而来。这一调查方法存在的主要问题是:①统计范围有限。劳动就业服务机构一般只局限于城市.对于农村众多的剩余劳动力就无法进行登记,这样,我国计算出来的失业人口就严重偏低。②时效性差。失业登记人数是按季汇总上报的,上报数很大部分是上季结转而来的,无法了解上季求职登记者目前的真实状况(有部分人可能已经找到了工作,成了就业者)。③有些人求职登记的目的仅仅是为了取得失业救济,他们并不是真正意义上的求职者。二是通过每10年进行一次的人口普查和两次普查之间进行的3%人口抽样调查搜集失、比方面的有关数据。这一方法存在的问题是间隔期长、时效性差,不能满足平时各方面对失业统计数据的要求。

    2.2  我国劳动力失业统计中存在的另一些缺陷
    我国劳动力失业统计中存在的问题还具体表现在以下几个方面:

    (一)失业定义中的"工作时间"定额太低
    在我国的调查失业定义中,把在调查标准时间前一周内从事有收入的劳动时间不足1小时者均视为失业人口。因为一周工作一小时,按照我国目前的工资水平,一个普通人显然不能维持其正常的生活。

    (二) 统计范围狭窄
    我国目前对外公布的只有城镇登记失业统计,它以户籍为依据,是二元户籍管理制度的产物,是户口与就业等各种社会待遇挂钩的结果,其统计的范围与国际通行的失业统计相比要小很多,主要表现在以下几个方面:

    第一,不包括城镇非常住人口。我国的失业统计按常住人口登记的原则进行劳动力抽样调查,而事实上,我国人口流动数量巨大,每年光是从农村流向城市的农民工就有数千万,忽略了流动人口的失业率统计,造成了盲流现象和社会的不安定。

    第二,没有把乡村人口纳入失业率的统计。我国是一个农业大国,乡村人口占人口总数的60%以上,见下表。
    数据来源:国家统计局所编(中国统计年鉴2001)第91页,中国统计出版社出版
    而在我国的从业人员中,乡村人口则占了70%以上的比重,见下表。

     数据来源:国家统计局所编(中国统计年鉴2001)第107页,中国统计出版社出版

    占人口总数及从业人员数如此大比重的乡村人口的失业情况在我国却一直没有得到反映,可以说是失业统计的重大缺陷。我国拥有1.3亿左右的乡镇企业从业人员,也面临着市场的考验和失业问题。我国的失业统计应该注意这些问题。

    第三,抽样比率太低。我国在城镇劳动力住户
抽样调查中,只抽取了2.5万人。以2000年城镇人口45594万人(已经剔除了不以户记的军人数250万)计算,抽样比大约为1/18238,而美国的则为1/1600。可见这个比率太低了。

    第四,失业统计的年龄界限僵化。我国的调查失业统计的年龄界限与国际一致,但是登记失业年龄界限却很不合理,仅限定为男16-50岁,女16-45岁,上限连退休年龄都不到(我国法定退休年龄是男60岁,女55岁),这一方面使得很多在劳动年龄内(一般是16-65岁)的人都没有包含进去,另一方面,很多超过退休年龄的人仍然具有劳动能力并且有工作要求,他们完全符合失业的定义,但是却没有被包含到失业人口中去。这必然使得城镇登记失业人数与失业率和实际值偏离较大。

    (三) 指标设计不完整
    具体表现在以下几个方面:
    第一,没有反映"就业不足"和"隐性失业"现象。就业不足的统计定义是指非个人原因,在调查周内工作时间不到标准时间的一半(即20小时),并愿意从事更多工作的人员。按此标准,我国就业不足人员是大量存在的,如单位的富余人员、农村的剩余劳动力等等。就业不足从工作时间上讲是处于就业状态(超过正常工作时间的1/3),但是这种就业并不让人满意,人们仍然有寻找更多工作的意愿,因此失业统计中应该另设指标对此进行反应。

    隐性失业的通俗解释是:形式上就业,实际上没有就业。经济学解释就是边际劳动生产率为零或者负数的就业。这种情况在我国城乡非常普遍。当然,隐性失业人口中的绝大部分是就业不足人员,二者在很大程度上基本相同,只是隐性失业更为严重和隐蔽,因为他的劳动时间也许达到了就业的定义,但是他创造的边际利润却等于零或者为负。对这部分人的测定和统计,显然更为困难,但是完全不反映这个现象绝对是失业统计的不足之处。

    第二,在失业指标设计上,缺乏深度和广度。我国的失业统计仅有失业人数和失业率指标,然后是根据年龄、性别和失业原因等对失业进行的简单分析的表格,缺乏大量的具有深度和广度的其他数据,如按产业、地区、失业时间长短等划分的失业数据。我国正在进行产业结构的调查,由此带来的就业和失业情况究竟如何,对政府制定政策有很大影响;我国地区间发展速度不同,失业水平也是不同的,但是缺少具体数据的支持,这也不利于当地政府进行调控和人们理性选择就业地区;分析失业时间的长短也能判断我国的经济周期等情况,反映了失业和就业的连贯性。但是失业统计体系却缺少这些数据,这使得它的使用价值大大降低了。

    4.操作性问题  第一,时效性不强。我国失业人口统计资料(主要是城镇登记失业情况)是以年末最后一天的失业人员计算的,不能反映全年的失业情况,部分失去了政策依据的价值。试想,在年末一个失业一年的劳动者和一个失业一周的劳动者怎能同日而语?然而他们被等同的计人了失业人数。
目前主要市场经济发达国家失业率调查的频率是:美国、加拿大、日本、澳大利亚、韩国是每月调查五次,英国、法国、德国是每年调查一次(这三个国家的月度失业数据为登记数)。我国显然还存在差距。

    第二,登记失业并不完善、严密。国家统计局的统计仅限于在当地就业服务机构正式登记的失业人员,没有正式登记的就不算在失业之列。这样的标准有两个缺陷:一是失业、下岗人员如果没有及时进行登记,在统计时就难免被遗漏;二是导致了以"登记与否"为依据,而不是根据"劳动事实"来登记失业。例如:部分进行登记的人员可能仍在从事有报酬的工作,且工作时间超过规定的时间(比如一小时),如零工、摊贩(事实上的就业者)等却被统计在失业者之中;有的登记失业人员在找到工作以后不去劳动部门消除登记。这些情况都影响了统计数字的准确性。

    针对我国劳动力失业情况存在的以上数方面问题,笔者提出了以下方案的设计,以供研究和讨论。

    (三)对劳动力失业统计方法的改进建议与方案的设计
    3.1 抽样设计方案的思路
    劳动力就业失业情况是一个较大范围内的问题,我们假定抽样调查的总体是湖南省范围内的总人口,如果不充分利用现有的抽样调查网络开展工作而另行建立新的调查网络,不仅耗资巨大,而且无法保证时效性,也很难保证调查的质量。因此,充分利用城调队、农调队在全省都有现成的调查网络,而且可以保证调查质量。

    3.2 抽样方案设计
    抽样方案包括两部分内容,一是抽样方法的选取,二是样本容量的确定及分配。本次调查采用分层三阶等距随机抽样。如果考虑到经费等因素,我们就假定样本容量为10000人。

    1.层的划分及样本量在各层的分配
    社会的就业率,城乡劳动力在就业的类型、劳动就业时间、劳动效率等方面存在一定差异。为调查能更全面、更客观地反映全省劳动力就业状况及评价,决定将全省劳动力分为非农业人口和农业人口两层,两层都进行抽样调查。实施分层抽样不仅可以提高样本的代表性,有利于估计精度提高,而且每层都可以单独地作为一个子总体看待,利用各层的调查结果对本层次劳动力的就业情况提供有价值的信息。例如利用农业人口层的调查结果可以了解农村就业情况。同时分为非农业人口层和农业人口层后还可以充分发挥城调队和农调队两支调查队的工作优势,快速便捷地获得所需信息。初步分析了城乡劳动力就业的基本情况后,决定城乡样本量分配比例为6:4,即在非农业人口层中调查6000人,在农业人口层中调查4000人。

    2、第一阶抽样及一级样本量的确定
    在非农业人口层,以市、地作为一级抽样单元,第一阶抽样对市、地进行。按照每个市、地调查1000人的规模,需抽取6个市、地。考虑到湖南省东、西部经济发展不平均等因素,为提高样本的代表性,全面、客观地反映非农业人口劳动力就业的基本情况,决定以市、地人均收入为排列标识,将全省的市、地按照由低到高的顺序排列,实施等距抽样。等距抽样的优点一是抽样方便,二是样本在总体中分布均匀,代表性好。因为14个市、地需抽12个,这里存在的问题是14不能被12整除,而等距抽样中的抽样间隔必须为整数,这可应用拉希里圆形抽样方法解决。将14个县按人均收入由低到商的顺序排列成一个圆,首尾相接,因14/12=1.16,故可取抽样间隔为2。在1-14中随机抽取一个整数,以它作为样本的初始单元,然后按排列顺序每间隔3抽取一个单元,直至抽足6个单元为止。所以在等距抽样下唯一的抽取方式是编号为奇数的第1、第3、第5、第7、第9、第11、第13 、第2 、第4 、第6 、第8、第10的12个市地人样,它们构成非农业人口层的一级样本。

    在农业人口层,以县及县级市作为一级抽样单元,第一阶抽样对县进行。按照每个县均调查500人的规模,需抽取8个县。因为全省并非所有的县都有农调队建制,故只能在已有建制的县中抽取。从72个县中抽取8个县相当于对县级总体的二阶抽样。为提高样本代表性,也是以县人均收入为排列标识,将72个县按照由低到商的顺序排列实施等距抽样。所以在等距抽样下唯一的抽取方式是编号为奇数的第1、第10、。。。、第64、8个县入样,它们构成非农业人口层的一级样本。

    3、第二阶抽样及二级样本量的确定
    在抽中的12个市、地以户作为二级抽样单元,第二阶抽样对户进行。各市、地城调队均已按随机抽样方式抽取了500户作为记账户开展调查,而且为了防止样本老化每年轮换1/3。在保证样本代表性的前提下,考虑到调查费用等因素,本次调各调查市、地就直接利用现有的500户记账户作为二级样本。对每市的500户记账户,按人均收入由低到高排列,取抽样间隔为2实施等距抽样得到容量为500的样本户,以此作为本次三阶抽样的二级样本。整个非农业人口层的二级样本量为6000户,每个被抽中的市、地二级样本量为500户。

   在抽中的8个县,也是以户作为二级抽样单元,第二阶抽样对户进行。同样,各县农调队均已按随机抽样方式抽取500户作为记账户开展调查,而且每年轮换1/3。在保证样本代表性的前提下,本次调查各调查县也是直接利用现有的500户记账户作为二级样本。整个农业人口层的二级样本量为4000户,每个被抽中的县二级样本量为500户。

    4、第三阶抽样及三级样本量的确定
    在样本户中以人作为三级抽样单元,第三阶抽样对人进行。因为全省样本总量为10000人,样本户已确定为10000户,因此每个样本户只随机抽取1人调查。

    在户内进行随机抽样可利用表1进行。将被访户家庭成员的年龄按由高到低的顺序排列填写在表的第3列,年龄在4岁以下或75岁以上的人不列入。已列入表内的家庭成员所在行的序号即为其编号。在表上方的抽样号码栏中找出与问卷编号员末一位数字相同的数字,在该数字上画图,被因数字所在列与该户已填入表内的员年轻的家庭成员所在行交汇处的数字即该户被抽中的人的编号。然后在抽样表上该编号所在行相应处划√,以下的所有调查都是对被抽中的这个家庭成员进行。

    3.3目标量的估计
    根据调查问卷,此次调查指标多达近50个,这些指标按其性质可以分成两类。一类是总体的各种比例,如总体中对职业类型"全职工作"比例,总体中对职业类型"兼职工作"的比例。另一类是子总体的各种均值,如总体中某一行业的平均薪资,此时这一行业的从业者构成总体的子总体。下面分别就两类指标给出其估计量。

    1、总体比例的估计
    设总体含N个三级抽样单元,其中非农业人口层三级抽样单元数为N1.农业人口层三级抽样单元数为N2,显然X=N1十N2记


    分别称w1、w2为非农业人口层和农业人口层的层权。记
      r=l,2,i=l,2,…,nr,j=l,2,…,500
    此处r表示层的编号,i表示一级单元编号,j表示二级单元编号,k表示三级单元编号,因在样本户中只抽1人,故k即该人在抽样表中的序号。n1=12,n2=8分别是两层抽中的市地数和县数。则


    即第r层所有被调查者对该选项作出肯定回答的人数,而第r层的样本总量为500nr,故
                  
    即第r层对该选项作出肯定回答的样本比例,它给出总体第r层该选项比例Pr的估计。由于第一阶抽样是等距抽样,第二、第三欧抽样均为简单随机抽样.故Pr是Pr的无偏估计,即EPr=Pr。记
                   


    则即第r层第i一级单元对该选项作肯定回答的样本比例。由于在一级单元内进行的第二、第三阶抽样均为随机抽样,故 为无偏估计。由Px的结构易知
                                        
    即将某层各一级单元的样本比例求平均即得相应的样本比例
    为得到总体比例P的估计,取加权平均值
      
    由分层随机抽样理论知,各层样本比例按总体层权加权估计量是总体比例的无偏估计。
总结上述,(2)式给出计算菜市、地或县样本比例的公式,(1)式或(3)式给出计算某层样本比例的公式。它们都是无偏估计,可用作总体的相应比例的估计。

    2、子总体均值的估计
    此次调查的一些项目是对某些数值的估计,根据调查问卷,评价按4个档次打分。此时通过样本调查要估计的平均值是子总体的均值。
    
    记mn为第r层第i一级单元的容量为500的三级单元样本中属于子总体的样本单元数,显然o<mn<100。记 为第r层第i一级单元第j二级单元属于子总体的三级单元对某一项目的估计值,此处r表示层的编号,i表示一级单元编号,j表示二级单元编号,k表示三级单元编号,因在样本户中只抽1人,故k即该人在抽样表中的序号,则


    即第r层所有属于子总体的被调查者对该项目估计的总分,此处n1=12,n 2=8。第层属于子总体的样本量为 故
     

                

    即第r层该项目估计的样本平均值,它给出第r层对该项目估计的平均值Y r的估计。由于第一阶抽样是等距抽样,第二、第三阶抽样均为简单随机抽样,故 是 的无偏估计。记
                           

    由分层抽样理论知,形如(6)式的按总体层权加权形式的估计量是总体总平均分Y的无偏估计。
总结上述,(5)式给出计算菜层样本平均分的公式,(6)式给出计算全省样本平均分的公式。它们都是无偏估计,可用作总体的相应平均分的估计。


    3.4精度(误差)分析
    抽样调查是利用样本提供的信息对总体目标量如总体比例、总体均值进行估计。由于样本只是总体的一部分,在大多数实际调查中往往只是总体的很小一部分,而且抽样又是随机进行的,因此样本提供的信息是不完整、不全面且带有随机干扰的信息,利用这种信息对总体目标量进行估计不可避免地存在抽样误差。为了对抽样方案及抽样调查结果进行评价,在给出目标量的估计量或估计值的同时,必须给出误差估计,进行精度分析。

    描述估计量精度可以用不同的方法,最常用的有两种。一种是用估计量的方差,一个估计量方差越小,精度就越高。另一种是给定一定的概率,要求估计量的绝对允许误差不超过一定限度,这个限度称作绝对误差界。概率越大,估计的可靠度就越高;绝对误差界越小,估计的精度就越高。精度的这两种不同提法是等价的,可以相互转化。

    1、 总体比例估计的精度分析
本次调查绝大多数指标属于总体比例P。对于比例总体,抽样理论证明总体方差S2=P(1一P)。在规模很大的总体中进行简单随机抽样,以V记估计量的方差,抽样理论证明,估计量方差V与总体方差S2及样本容量n有下述关系

    对于比例的调查,样本比例P的方差估计为



    由于o<P<l,故P(1一P)<0.25,从而不论实际的比例如何取值,在样本容量n固定的条件下,总可以给出总体比例的保守方差估计即


    表2给出样本容旦n=1500时对于不同的P值,样本比例的方差估计。

    但是本次调查的抽样方法是分层三阶等距随机抽样,是几种基本抽样方法的有机组合,属于复杂抽样设计。为了结出复杂样本估计旦方差的估计,需要借助于设计效应Deff。理论分析和实际经验表明,类似于本抽样方案的复杂抽样的设计效应大约为2。故在本方案下,样本比例的方差估计如表3。
如果要求以样本比例p估计总体比例P时绝对误差界为d,概率为1-α(o<α<1),即


在样本量较大的条件下P近似服从正态分布,从而对给定的樱率1一α,查表得标准正态分布上 分位点 ,使


其中VP是P的方差。因而给定了VP的值V及概率1一α后,由


    即可求出d值。实际中最常用的概串为0.95,相应地 =1.96,对于样本比例的不同取值,可以由表4得到相应的绝对误差界。

    表4表明,当样本容量n=1500,样本比例P=0.5时,总体比例的可靠度为95%的区间估计为
(0.5-0.0358,0.5十0.0358)=(0.4642,0.5358)

    即总体比例的区间估计为(46·i2%,53.58%),而当中取其它任何值时,区间长度都比它短。因此可以断言,对于本次调查的所有比例指标,在样本容旦为1500时,可以以95%的可靠度保证比例估计的倔差最多为土3.58%,其中有些比例估计值的误差范围当然比上述范围还小。
   
    2、子总体均值估计旦方差的估计
    此次调查的另一类指标是子总体均值。分层三阶等距随机抽样是由几种基本抽样方法有机组合的复杂抽样,很难给出估计量方差的无倔估计旦。因此在对于总体均值估计量的方差进行估计时,我们使用了随机组方法。

    在非农业人口层和农业人口层中我们分别将两个层的级样本各随机划分为b组,此处b=3。非农业人口层一级样本量n1=12,分4组每组含3个市、地;农业人口层一级样本量n2=8分4组每组含2个县。
对于第r层,我们按(5)式构造第α个随机组的估计量

     其中 表示第r层第α随机组的样本数据,然后在两层中任意各取一个随机组搭配在一起形成分层抽样的一个随机组,显然这样的随机组共有3个,按(6)式,第h个随机组的全省平均值的估计量为


    则全省平均值 的估计量 的方差的随机组估计为
   
3.5 抽样调查表设计(附)

           湖南省劳动力情况抽样调查表                  问卷编号:   
尊敬的朋友:
    为贯彻湖南省政府决定精神,做好湖南省劳动力就业失业情况统计调查工作,请您协助完成如下调查内容,请勿必如实回答,我们将为您忠实保守个人隐私,我们将在接下来的工作中充分研判您的意见,由此指导政府工作,以求努力进一步改善我省就业情况,将湖南省建设成为您与我们共同的乐土!

    表A:基本情况表
  
  A-1 姓名:                                               
    A-2 性别:                                               
    A-3 年龄:                     
    A-4 家庭成员人数:                  
    A-5 在家庭中身份:                  
    A-5 户籍类型:                                                    
        A:湖南省常住居民   B:非湖南省常住居民                                         
    A-6 婚否:                                                    
        A:已婚   B:未婚
    A-7 受教育情况:                                              
        A:高中以下   B:高中   C:本科及专科  D:研究生及以上
    A-8 您现在的劳动状态:                                            
        α1:全职工作                    α2:在校学习并在假期打工
        α3:在校学习并在学习期间兼职      α4:受雇于非考试期间
        β1:待业――无工作但仍在积极寻找   γ1:并非以上任何一种情况
    本题中如选择α系列请跳至表B;选择β系列请跳至表C;
    选择γ系列请跳至表D。
    表B:在业
    B-1 上个星期您的职业是什么?(请回答您的主要工作及其名称)
        答案:                                                        
    B-2 上个星期您的主要工作是什么?(请回答您所完成的或被分配的任务)
        答案:                                                        
    B-3 上个星期您在什么地方工作?
        答案:                                                        
    B-4 上个星期您是什么工作状态?                      
        A:员工    B:雇主    C:个体    D:家务劳动者
    B-5 上个月您得到的工作收入(不包括奖金)                   
        A:1000元以下   B:2000-3000元   C:3000-5000元  D:5000元以上
    B-6 您通常每天工作多长时间?                        
        A:6小时以下    B:6-7小时   C:7-8小时     D:8小时以上
    B-7 您每周通常工作多少时间?
    答案:                                                        
    B-8 上周您的工作类型是什么?                      
         A:全职 B:兼职(暂时性) C:兼职(长期性) D:国家公务员
    B-9 您开始目前的工作多长时间了?                       
       A:少于6个月     B:5到10年    C:6个月至一年    D:10年以上
    (兼职者填写下两题)
    B-10 您是否愿意加班?                                 
      A:是的                   B:不
    B-11 您是否有加班?                                  
      A:是的                   B:不
    表C:失业
    C-1 您已经花费多少时间来寻找工作了?
        答案:                                                        
    C-2 在最近4周您一直在寻找什么工作?
        答案:                                                        
    C-3 您在最近4周采取了哪些渠道寻找工作?                             
        A:在人才市场登记注册。           B:利用广告或写推荐信到公司
        C:寻求家人和朋友的帮助  D:利用因特网寻找工作     E:自己创业或其它
    C-4 您是否曾经工作过?
        A:是        B:否(结束)
    C-5 您上次的工作是什么?
        答案:                                                        
    C-6 您上次工作的薪资是多少?                                   
        A:1000元以下   B:2000-3000元  C:3000-5000元   D:5000元以上
    C-7 您希望您将来的工作薪资是多少?                            
        A:1000元以下   B:2000-3000元  C:3000-5000元   D:5000元以上
    C-8 从您辞去您上一份工作至今过了多久了?
       A:少于6个月     B:1到2年    C:6个月至一年    D:2年以上
    C-9 您为什么离开您的上一份工作?(主要原因)                           
        A:公司裁员   B:跳槽   C:解雇  D:合同到期  E:生病、受伤、或是其它事故    F:退休    G:工资太低    H:工作环境差    I:公司前景不好   J:工作强度太大      K:与老板或同事的关系问题    L:家务、照顾老人、小孩或病人    M:深造     N:不想工作   O:为创业作准备    Q:其它
    表D: 其它情况
    D-1 您为什么不工作或是找工作?                         
        A:在求学         B:等待某些考试的结果        C:参加职业培训课程
        D:从事家务       E:育儿       F:照顾老人或病人
        G:身体状况不好  H:年龄问题      I:残疾或有先天疾病
        J:退休     K:有足够的财政支持    L:觉得没有合适的工作
       M:没有必要的证书,培训,技能和经验     N:其它
    D-2 你以前是否工作过?                      
        A:是       B:否(转到第四题)
    D-3 您最后一次工作是被裁员的吗?                       
        A:是       B:否
    D-4 您今后是否打算再工作?                          
       A:是       B:否(结束)
    D-5 您打算什么时候工作?                              
        A:少于半年         B:半年到一年   C:一年到两年         D:两年以上
    D-6 您更倾向于全职还是兼职?                          
        A:全职  B:兼职                               谢谢您的支持与配合!

    (四) 结论
    本文针对我国目前劳动力失业、就业情况调查分析的现状,存在的不足和缺陷等作了一个的介绍,随后假设对湖南省的劳动力情况作调查,涉及了一个模型,其中首先采用了分层三阶等距随机抽样的方法抽取样本,然后分别对总体比例,子总体均值进行估计,并对估计的精度的评价方法进行了总结。本文的目的是针对目前现行的调查方法存在的缺陷提出一些改进的意见,随着社会经济的发展,我们在作具体问题的抽样调查时,不能固定不变地套用以上模型,而是应该收集最新的数据,重新进行研究分析,以此得出最适合最新的抽样调查方案,尽可能减少统计调查中的非抽样误差。
[长沙市统计局 黄智力 孙铁如  供稿]

    参考文献
    [1]施锡铨主编. 抽样调查的理论和方法. 上海:上海财经大学出版社,1999.5
    [2]李瑛珊.完善我国失业统计指标体系的思考. 统计与决策,2001.3
    [3]裘雨明.浅议我国失业统计存在的问题及改革对策.绍兴文理学院学报,2000.4
    [4]郑庆安,夏远洋.我国失业统计存在的问题与改革建议. 对外经济贸易大学学报,2003.1
    [5]刘瑾,张改菊,张惠萍. 中国失业统计制度及其分析.山西统计,2000.7
    [6]俞纯权.山东电视观众满意度调查抽样方案设计. 数理统计与管理,2001.2
    [7]朱小雷.步行商业街环境和使用行为调查与多元统计分析. 规划.园林建筑及绿化,2002.6

                                                                                               

扫一扫

在手机打开当前页

关闭
相关附件
相关阅读