复旦大学长三角地区社会变迁调查(FYRST)上海地区抽样报告
复旦大学社会科学数据中心
2014年7月1日
复旦大学长三角地区社会变迁调查(FYRST)上海地区抽样报告
一、调查目标总体和样本设计
复旦大学长三角地区社会变迁调查(Fudan Yangtze River Delta Social Transformation Survey)是以跟踪1980-1989年(简称80后)出生的一代人为主体,以“长江三角洲经济圈”(简称长三角)调查区域,深度了解调查对象和所处社区的过去三十年以及未来的发展变化情况的一次大型综合调查。
“长江三角洲经济圈”是我国经济最发达的地区之一,处于我国改革开放和社会变迁的前沿。长三角以上海为龙头,包括江浙15个地级城市,即江苏的苏州、无锡、常州、镇江、南京、扬州、泰州和南通,和浙江的杭州、宁波、嘉兴、湖州、绍兴、舟山和台州。虽然长三角的面积不到全国的1%,其总人口超过一个亿,经济总量占全国的五分之一,人均国民生产总值超过一万美元(见附件一)。“复旦大学长三角地区社会变迁调查”对分析和了解中国社会在产业(后)工业化、生活城市化、经济全球化、人口老龄化的全方位变迁具有极为重要的意义。
“复旦大学长三角地区社会变迁调查”的目标总体为长三角地区生活在家庭户中的出生于1980年代的人口(80后)。研究的范围包括这一代人的家庭、婚姻、就业、迁移、住房、生育、子女教育、父母养老等各个方面。
调查基于江浙沪长三角区域各有代表性的原则,三地各自单独抽样。综合考虑样本代表性、抽样效率和跟踪调查实践操作的可行性,目标有效样本量为江浙沪各2000人。
二、上海抽样方案和样本量的确定
本次调查按区县分层,对乡镇街道(街镇)、居/村委会(社区)、地址、个人(80后)四阶段抽样。按区县进行分层可以细化抽样框,使得样本点相对分散,有利于提高样本的总体代表性。在区县内利用社会经济发展指标排序能进一步提高抽样效率。整群抽样虽然会降低抽样效率,但有利于调查的管理和执行,提高调查质量。
抽样的第一步用PPS系统抽样的方法,在上海17区县先抽取40个街镇,再抽取80个社区。在社区一级,鉴于上海流动人口众多、人户分离严重,行政登记的常住人口资料往往不能反应实际情况,但门牌地址系统相对完整,分三步获取80后调查对象样本: 1)随机选取地址, 2)对选中地址排查常住人口, 3)随机抽取80后调查对象。
根据以往调查经验和调查进度要求,本次调查的目标有效样本量为2000人。考虑到调查的执行过程中,访问失败、拒访等因素,为达到目标样本量,本调查采取扩大基础样本量的方法。
根据第六次人口普查数据,上海约三分之一的家庭有80后,再根据以往经验,复旦大学调查中心上海入户访问的成功率大体能实现60-70%。因此决定在每个社区随机抽取130个地址,基础样本量约为3470个地址/人(80*130*1/3)。为减少地址空号、空关房和非居民房等对抽样的影响,每个社区另留20个备用地址。根据70%的访问成功率估计,预期有效样本为2400人。即使只达到60%的访问成功率,预期有效样本仍然可以保证在2000人以上。
三、具体操作
因为样本总体是80后(个人),理论上各层级的抽样应该以80后的人数作为计算抽样概率和样本权数的基础,但现实中没有现成的80后人群的样本框。本次调查以第六次人口普查取得的乡镇街道一级80后的人数为基础,结合社区一级统计的2012年实有人口,来确定80后样本数,并以此计算区县、街镇和社区三级的概率抽样的基础。
具体操作步骤说明如下:
1. 调查共设40个初级样本单位(街镇)。上海共有17个区县,40个初级样本单位的分配为每个区县2个乡镇街道;另外考虑人口规模,浦东的初级单位样本增加为5个,闵行、松江和普陀的的初级单位增加到3个。
2. 在每个区县内,全部乡镇街道按社会经济发展指标排序,累积各乡镇街道的人口数按分配的初级单位样本数进行PPS系统抽样。
3. 在确定40个初级抽样单位后,二级单元抽样框为样本单位内所有社区(社区居/村委会),根据各社区人口规模排序进行系统抽样,抽取2个居委会。(见附件二:“复旦大学长三角地区社会变迁调查”上海市社区样本名单和地图)
4. 进行社区调查,同时取得社区的全部地址清单。(见附件三:社区调查表/附件四:社区地址清单收集表。)
5. 利用地址清单,每个社区随机抽取130个地址(外加20个作为备用)。对于抽中的地址,获得所有居民户成员的人口学信息。居民户成员定义为“所有过去一周在该地址居住的人口。”(附件五:家庭基本情况调查表。)
6. 在居民户样本中,根据出生年月筛选符合要求(80后)的目标对象,按随机原则确定被调查对象。
四、实际调查结果和样本权数确定
实际调查覆盖全部上海17个区县,进入初级抽样单位的全部40个街镇。80个次级抽样单位(社区)中,针对执行过程中遇到的困难(主要是居委会拆迁和撤并),对6个社区根据就近和近似的原则进行了替换。另有3个社区,因为调查员和行政协调的原因,未能完成调查。
原计划每个社区随机抽取130个地址,外加20个作为备用,实施中全部都使用了150个地址。本次调查的实际接触样本量为3338,完成调查的有效样本为2362,总体成功率约为70%,基本和设计预期相符。
虽然样本设计采取了近似自加权的方式,但因为区县样本分配比例不同而且调查的完成情况各社区有较大的差异,调查的结果需要进行加权处理,方差的计算更需要考虑复杂的抽样设计因素。
样本权数等于抽样的各层和阶段的设计抽样概率和完成比例的积的倒数。其中区县街镇两级的抽样概率根据2010年普查得到的80后人数计算,社区一级的抽样概率根据2012年实有人口推算,社区内的抽样概率根据地址清单和常住人口调查计算。具体见以下公式:
其中,Y为2010年普查80后人数,P为2010年普查的总人口,A为调查取得的地址总数,m为样本地址中80后总人数,n为实际调查完成数。下标i代表区县分层,j代表初级单元(街镇),k代表二级单元(社区)。对于3个没有完成调查的社区,其权数在区县内重新分配。
附件一:长三角地区16个地级以上城市人口经济指标
| 人口(万人,六普) | GDP(亿元,2011年) | 人均 GDP(元/人) | 人均GDP(美元/人, 汇率=6.488) | |
3000 | 上海市 | 2302 | 16872 | 73297 | 11348 |
3101 | 南京市 | 800 | 5010 | 62593 | 9691 |
3102 | 无锡市 | 637 | 5758 | 90355 | 13989 |
3104 | 常州市 | 459 | 2977 | 64824 | 10037 |
3105 | 苏州市 | 1047 | 9000 | 85993 | 13314 |
3106 | 南通市 | 728 | 3418 | 46931 | 7266 |
3110 | 扬州市 | 446 | 2208 | 49509 | 7665 |
3111 | 镇江市 | 311 | 1957 | 62858 | 9732 |
3112 | 泰州市 | 462 | 2003 | 43359 | 6713 |
3201 | 杭州市 | 870 | 5946 | 68340 | 10581 |
3202 | 宁波市 | 761 | 5126 | 67394 | 10434 |
3204 | 嘉兴市 | 450 | 2296 | 51003 | 7897 |
3205 | 湖州市 | 289 | 1302 | 44982 | 6964 |
3206 | 绍兴市 | 491 | 2783 | 56650 | 8771 |
3209 | 舟山市 | 112 | 633 | 56492 | 8747 |
3210 | 台州市 | 597 | 2415 | 40462 | 6265 |
长三角地区 | 10763 | 69703 | 64761 | 10027 |
附件二:“复旦大学长三角地区社会变迁调查”上海市社区样本名单和地图
区县 | 街道/乡镇 | 居委会 |
静安 | 江宁路街道 | 永乐居委会 |
蒋家巷居委会 | ||
静安 | 南京西路街道 | 延中居委会 |
茂北居委会 | ||
黄埔 | 豫园街道 | 侯家居委会 |
肇方居委会 | ||
半淞园路街道 | 西三居委会 | |
西二居委会 | ||
长宁 | 江苏路街道 | 东浜居委会 |
利西居委会 | ||
北新泾街道 | 新泾三村居委会 | |
新泾八村居委会 | ||
虹口 | 嘉兴路街道 | 金田居委会 |
香港丽园居委会 | ||
江湾镇街道 | 池沟路居委会 | |
场中居委会 | ||
徐汇 | 湖南路街道 | 金波居委会 |
陕新居委会 | ||
枫林路街道 | 沈家里居委会 | |
张东居委会 | ||
浦东 | 陆家嘴街道 | 梅园一村居委会 |
崂山二村居委会 | ||
川沙镇 | 黄楼居委会 | |
界龙村村委会 | ||
东明路街道 | 凌兆新村第七居委会 | |
金橘苑居委会 | ||
惠南镇 | 卫星居委会 | |
远东村村委会 | ||
塘桥街道 | 文兰居委会 | |
东方居委会 | ||
奉贤 | 金汇镇 | 泰绿社区居委会 |
乐善村村委会 | ||
奉城镇 | 头桥第一社区居委会 | |
奉城村村委会 | ||
青浦 | 徐泾镇 | 徐泾居委会 |
前明村村委会 | ||
朱家角镇 | 东湖街居委会 | |
沙家埭村村委会 | ||
金山 | 枫泾 | 中洪村村委会 |
贵泾村村委会 | ||
亭林 | 恒信居委会 | |
合兴村村委会 | ||
嘉定 | 马陆镇 | 沥苑社区居委会 |
立新村村委会 | ||
徐行镇 | 曹王村村委会 | |
白墙村村委会 | ||
松江 | 中山街道 | 平桥居委会 |
蓝天一村居委会 | ||
九亭镇 | 亭福居委会 | |
牛车泾居委会 | ||
泖港镇 | 腰泾村村委会 | |
田黄村村委会 | ||
宝山 | 吴淞街道 | 海滨新村居委会 |
永清二村居委会 | ||
顾村镇 | 大唐花园居委会 | |
丰水宝邸居委会 | ||
闸北 | 大宁路街道 | 广延路居委会 |
大宁路667弄居委会 | ||
临汾路街道 | 阳曲路470弄居委会 | |
闻喜路555弄居委会 | ||
普陀 | 长风新村 | 长风二村第一居委会 |
金沙居委会 | ||
石泉路街道 | 石泉新村第三居委会 | |
联合新村居委会 | ||
宜川路街道 | 宜川三村居委会 | |
平江居委会 | ||
杨浦 | 大桥街道 | 引翔港居委会 |
广杭居委会 | ||
殷行街道 | 闸一居委会 | |
殷行路二百五十弄居委会 | ||
闵行 | 江川路街道 | 沧源新村第二居委会 |
富仕名邸居委会 | ||
颛桥镇 | 兴银花园居委会 | |
中心村村委会 | ||
虹桥镇 | 锦锈江南家园居委会 | |
金汇花园第二居委会 | ||
崇明 | 城桥镇 | 湄洲新村居委会 |
山阳村村委会 | ||
竖新镇 | 油桥村村委会 | |
育才村村委会 |
附件三:社区调查表(另附)
附件四:社区地址清单收集表
区 街道 居委会 片区 | 第 页 | |||||
地址(路 / 弄 / 号) | 室 | 房型 | 住户类型 | 户/人数 | 备注 | |
1 | ||||||
2 | ||||||
3 | ||||||
4 | ||||||
5 | ||||||
6 | ||||||
7 | ||||||
8 | ||||||
9 | ||||||
10 | ||||||
11 | ||||||
12 | ||||||
13 | ||||||
14 | ||||||
15 |
附件五:家庭基本情况调查表