地区内客车按是否营业性及标识客位分子层的方法及代码 表1.2
<font size=+1>
-----------------------------------
核定客位X(座) | 营业性 | 非营业性
--------------|---------|----------
X≤5 | 11 | 21
--------------|---------|----------
5<X≤15 | 12 | 22
--------------|---------|----------
15<X≤30 | 13 | 23
--------------|---------|----------
30<X≤45 | 14 | 24
--------------|---------|----------
X>45 | 15 | 25
-----------------------------------
</font>
3.2 样本量的确定与分配
3.2.1 省内样本量的确定
本方案按照对省的主要指标Y(客、货运量与旅客、货物周转量)的要求精度,首先确定全省样本量,然后在地区层与子层进行分配。
当在95%的置信度下,极限相对误差为10%~20%(视车辆拥有量不同而有所区别),估计层内变异系数不超过1时,在对样本车进行3个工作日或两个车次运输量统计的情况下,省内的最低样本量确定如下:
省汽车最低样本量 表2
<font size=+1>
----------------------------------
省车辆拥有量(辆) | 最低样本量(辆)
-----------------|----------------
N<50000 | 400
-----------------|----------------
50000≤N≤100000 | 700
-----------------|----------------
N>100000 | 1000
----------------------------------
</font>
注:车辆拥有量系指客车、货车的单项车辆数,不是合计数。表2中的最低样本量也分别指客、货汽车所需的最低样本量,不是指合计数。
3.2.2 各层样本量的分配
1)地区层样本量的确定
每个地区的样本量,按各地区车辆占全省车辆数的比重分配。即:若n为省样本量,N、Nh为全省及地区h的车辆拥有量,则地区h样本量的计算公式为:
n =nNh/N
h
2)地区大层内子层的样本量确定
每个地区各子层样本量,按各子层的车辆数及层内标准差的大小进行比例分配或最优分配。即:若地区h第1子层的车辆数为Nh1,调查指标的标准差为Sh1,则该子层的样本量(按最优分配)计算公式为:
n =n Nh2Sh1/∑Nh1Sh1
h1 h
若暂时没有标准差资料,则采用比例分配,计算公式为:
n =n Nh1/Nh
h1 h
3)要求每个子层的最低样本量
为保证精度,子层样本量在按以上原则分配后,要求每个子层
最低样本量为5。凡是达不到此标准者,则取n =5,以此确定每个吨位层、
h1
地区以及全省的实际样本量。
3.3 层内抽样方法
对每个地区按营业性质及标识吨位分成子层后,对各子层建立相应的抽样框。抽样框中的车辆无需按任何标识人为排队,按自然登记顺序即可。在每个子层内按以下两种方法中的一种进行抽样,抽取所需样本量的样本车辆(为简便起见,子层车辆总数Nh1与所需样本量n 中的足标省略,分别记为N与n。)。
h1
3.3.1 简单随机抽样
对于有条件的地区,建议采用简单随机抽样,具体步骤如下:
1)从1到N的N个整数中等概率地产生n个不同的随机数。
2)n个随机数对应编号的车即为样本车。
3.3.2 等距抽样
采用随机起点等距抽样抽取样本车辆,具体步骤如下:
1)确定抽样距离K
K=N/n
若N/n不是整数,则取K为最接近于N/n的整数。
2)确定随机起点r,在1-K间产生一随机数r。
+
3)以r为起点,每间隔K确定一辆车为样本车。即编号为r,r K,…,
+
r (n-1)K对应的车为样本车。
在各子层抽出样本车后,随即进行编码。方法如下:对每个样本给出一个七位数编码,前两位数为地区代码,第三位数为营业性代码,第四位数为吨位层代码(数字参见表1.1和1.2),第五位数为部门分类代码,最后两位数为子层内样本序号代码,图示为:
<font size=+1>
样本编码:□ □ □ □ □ □ □
| | | | | | |
--- | | | ---
| | | | |
地区代码-- | | | |
| | | |
营业性质代码-- | | |
| | |
吨位层代码-- | |
| |
部门分类代码-- |
|
子层内样本序号代码--
</font>
注:部门分类仅作事后统计用,不作为分层标识,故子层内样本序号不需按部门分列。
3.4 地区层内按吨(客)位事后分层方法
对于因特殊情况,无法在要求时间内建子层抽样框的地区,在征得省级抽样调查机构同意后,可在地区层内的所有车辆按3.3.1或3.3.2的方法一次抽取样本,为达到与分层抽样相应的精度,其样本量应在分配给该地区的样本量的基础上增加10%。
4 调查方法
4.1 调查方式
调查方式以调查员直接填写调查表的访户调查为主。在个别样本的“调查半径”(调查员办公所在地与样本车业主居住地间的距离)太长或因气候等特殊原因不便访户者,可用发函调查的方式。发函调查样本数占样本总体的比例应尽量少一些。
4.2 调查时间的确定
将每个地区的样本随机(基本)均分为三组称为“样本组”,以A,B,C表示。把样本组分别安排到调查月的上、中、下旬(称为“时间段”),调查访问日(调查员访问业主的日期,由调查员在该时间段内任意确定)前10天内最近三个工作日的运输情况,如果这10天内样本车辆未工作,则调查表中有关指标为零;同时对每辆样本车调查访问日前10天内样本车未工作的天数。对从事长途运输的车辆,若一个车次(车次指车辆完成一个完整的运输生产过程;即以上一次货物卸空〈旅客下空〉开始,到本次货物卸空〈旅客下空〉为止的整个过程)的时间超过3天时,则调查访问日前完成的最近两个车次。
如果调查期为1个月以上,在以后各月中可按顺序变换三个样本组的调查时间段。变换方式如下(以调查期3个月为例):
<font size=+1>
上旬 中旬 下旬
--------------------→
1 | A B C
|
2 | C A B
|
3 | B C A
↓
</font>
4.3 指标解释
有关指标的定义及计算方法,按有关规定执行。
5 数据处理程序与方法
5.1 调查表的审核与数据录入
样本车辆调查表收集齐全以后,应逐级进行审核,包括登记的内容是否完整,计算是否正确。对发现的问题要及时进行澄清与纠正。
经审核的调查表,以地区为单位按统一的数据库设计要求进行数据录入。为保证录入质量,应按规定的检查程序进行逻辑检查与统计检查,以便及时发现并纠正录入中的问题。经检查后的数据以软盘形式提交给省进行统一汇总与处理。有关数据资料(含软盘)保存5年。
5.2 全省数据汇总
省内统一按规定的公式对样本资料进行汇总,汇总内容主要是:对每个调查指标的推总估计及相应的精度估计。后者以估计量的方差或标准差给出。
数据处理的顺序是:先对每个样本车指标量进行计算,再按子层、地区层,最后对全省进行汇总。地区推总数据资料由省反馈。
5.3 数据处理公式
5.3.1 记号
h,h=1,2,…,L,地区层编号,其中L为省内地区数;
l,l=1,2,…,m,子层编号,其中m为子层数;
i,i=1,2,…,n ,子层内样本车辆编号,其中n 为h 层实
h1 h1 1
际样本量;
N,全省(客或货)车辆总数(总体大小);
L
Nh,第h地区车辆总数, ∑ Nh=N
h=1
m
Nh1,第h地区1子层车辆总数, ∑ Nh1=Nh
h=1
y i,样本车辆特定指标值和,X ,样本车辆标记吨位;
hl hli
Yh1,Yh1,h地区1子层指标总量及其估计量;
Yh,第h地区指标总量的估计X ,h1层车辆总吨位;
h1
Y,全省指标总量的估计;
V(·),估计量的方差估计;
-----
S(·)=√ V(·)
5.3.2 每个样本车辆调查月内指标和y 的计算
hli
调查工作日内的指标和 过去10天内未工作日数
y =----------×(1------------)
hli 调查工作日数 10
×调查月内日历天数 (1)
对调查两个车次的样本:
两个车次的指标和
y =--------×调查期内日历天数 (1)′
hli 两个车次日数
5.3.3 地区子层内Yh1的估计及其精度估计
样本车平均指标量
n
_ 1 h1
y =--- ∑ y (2)
h1 n i=1 hli
h1
样本车平均车吨位(客位)
n
_ 1 h1
X =--- ∑ X (3)
h1 n i=1 hli
h1
_
y
∧ h1 ∧
Yh1=---X =Rh1Xh1 (4)