
三、实证模型设定与变量选择
(一)实证模型设定
由于空间要素之间存在的自相关性,内生性问题无疑是本专题实证研究者面临的最为棘手的问题。一方面,遗漏变量问题是一个普遍存在的问题,可能存在若干地区固有的影响生产率的因素与经济集聚效应一同发挥作用的情况,因此将集聚因素从诸多相互交织的影响因素中分离出来是一件很困难的事情。若干不随时间变化的经济因素会使OLS估计方法得出的集聚对生产率的回归系数偏大,因为系数中混杂着非时变地区固有因素对生产率的影响。另一方面,经济集聚与劳动生产率之间可能存在互为因果的关系。在新经济地理学框架中,“累积循环律”(或称之为“正反馈”)是形成经济集聚的一个基础思想。某个地区可能因为一个微小的偶然事件引起了一个积累过程,在这个过程中,中心地区大量的厂商和工人的存在会激励更多的厂商和工人向中心集聚;大量的生产厂商在中心地区的集聚借助于外部性推动了中心地区劳动生产率的提高;中心地区劳动生产率的提高又会进一步吸引更多的生产厂商和工人进入该地区,进而形成一种循环累积因果。“新”新经济地理学在将企业异质性引入后也指出,企业异质性的存在会强化企业的自我选择效应,导致生产率较高的企业自动集聚到大城市或者较为发达的中心地区,而生产率较低的企业会逐渐扩散到外围地区。因此,高生产率的企业在中心地区的集聚自然导致了该地区总体生产率水平的提高(Baldwin和Okubo,2006)。虽然可以用工具变量解决内生性问题,但是一个好的工具变量是不容易找到的。既有的文献中,Ciccone(2002)、范剑勇(2006)和刘修岩(2009、2010)等使用行政区域面积作为工具变量。但是本专题认为行政区域面积与经济集聚程度之间并不存在显著的相关性,因此使用行政区域面积作为经济集聚的工具变量的做法是不可靠的。
鉴于此,本专题使用面板数据(Panel Data),而且采用Arellano和Bover(1995)提出的动态面板广义矩估计方法(广义GMM[15])来克服经济集聚和生产率之间的内生性问题。该方法使用内生解释变量的滞后值作为工具变量,可以有效分离出非时变地区固有因素的影响。
动态面板模型的基本形式为:

根据本专题实证分析的任务,需要在式(1)中加入若干控制变量,得到如下实证模型:

其中,扰动项由城市固定效应ui和随机扰动项εit构成。鉴于三次产业分类,同时为了分析不同产业的集聚水平对劳动生产率的不同影响,本专题实际将进行三项回归。

其中,各个变量的内涵与度量将在下面进行阐释。
(二)数据与变量
考虑到GMM仅适用于“短动态面板”(即n较大,T较小),而且为了尽可能地增大样本量以提高估计精度,本专题使用的面板数据包括海西经济区地理范围内的20个地级市2003—2014年的数据。数据来源包括:《中国城市统计年鉴》(2004—2015)以及《福建统计年鉴》《广东统计年鉴》《江西统计年鉴》《浙江统计年鉴》。本专题使用的计量软件是Stata12.0。
本专题的被解释变量是劳动生产率(LP)。考虑到三次产业分类,同时为了分析不同产业的集聚水平对劳动生产率的不同影响,本专题分别使用三种不同的衡量劳动生产率的指标:非农产业(即第二与第三产业的加总)劳动生产率、工业(即第二产业)劳动生产率、服务业(即第三产业)劳动生产率。三种指标的计算方法为:将非农产业、工业和服务业的GDP对应地除以非农产业、工业和服务业的就业量。[16]既有文献中,范剑勇(2006)、刘修岩(2009)、孙浦阳等(2013)、杨丽等(2015)也采用此方法衡量劳动生产率。
本专题的解释变量是经济集聚(Aggl),度量方法是使用某个地级市某个产业的就业量除以该地级市的行政区域土地面积。本专题之所以采用这种度量方法,有两方面的原因:第一,数据来源稳定可靠、方便易得;第二,从既有的研究文献来看,这种度量方法在产业集聚研究中使用广泛而且统计结果较为稳定。如Ciccone和Hall(1996)、Ciccone(2002)、范剑勇(2006)、刘修岩(2009、2010)、孙浦阳等(2013)、杨丽等(2015)均采用此方法。
本专题的控制变量包括:劳均人力资本(PCHC),等于每年普通高校在校学生数除以年末单位从业人员数;劳均固定资产投资(PCFI),等于年固定资产投资总额除以年末单位从业人员数;财政支出比重(POFE),等于每年公共财政支出除以该地级市当年的地区生产总值;外商直接投资占比(POFDI),等于每年实际外商投资额[17]/(固定资产投资额+实际外商直接投资额)。
(三)实证分析
对解释变量、被解释变量和控制变量的描述性统计如表1所示。可以发现:无论是从标准差还是变异系数[18]来看,各个变量在海西经济区内的不同地级市存在显著的差异。尤其是本专题所关注的工业集聚、服务业经济和非农产业集聚程度在20个地级市内以及不同年份的差异极大,变异系数均大于1。
表1 变量描述性统计结果

本专题的实证分析包括三项任务,即分别检验工业集聚、服务业集聚和非农产业集聚对工业劳动生产率、服务业劳动生产率和非农产业劳动生产率的影响,分别对回归方程式(3)、(4)和(5)。大致分为如下三个步骤:
(1)扰动项自相关检验
使用广义GMM有两个前提条件:一是扰动项{εit{不存在自相关,二是{Δyi,t-1,Δyi,t-2,……{与个体效应ui不相关。第一个条件可以进行严格的检验,然而第二个条件目前尚无法进行严格有效的统计检验,只能根据经济常识判断经济变量是否在稳态附近。因此,本专题使用Arellano-Bond Test对广义GMM扰动项的自相关性进行检验,表2是检验的结果。
表2 广义GMM扰动项自相关性检验[19]

从表2可知,回归方程式(3)、(4)和(5)均通过了扰动项自相关性检验,所以广义GMM对回归方程式(3)、(4)和(5)是适用的。
(2)过度识别检验
广义GMM使用内生解释变量的滞后值作为工具变量,可以有效分离出非时变地区固有因素的影响。但是,这种方法下是否所有的工具变量都有效?为此,必须对回归方程式(3)、(4)和(5)进行过度识别检验,表3是检验的结果。
表3 过度识别检验[20]

从表3可知,回归方程式(3)、(4)和(5)是恰当的设定,可以进行广义GMM估计。
(3)回归估计
在确定了广义GMM的适用性之后,依据回归方程式(3)、(4)和(5)对各个系数进行估计,表4是估计结果的汇总。
表4 各行业经济集聚对劳动生产率的影响

根据表4,式(3)的估计结果显示,工业集聚对工业的劳动生产率会产生显著的正向影响:每当工业集聚度提升1个单位,工业劳动生产率会同步提升大约2.24个单位,这基本符合既有研究中的劳动生产率变动幅度。但工业劳动生产率的一期滞后值对本期劳动生产率的影响不显著为正。
式(4)的估计结果显示,服务业集聚对服务业的劳动生产率会产生显著的正向影响:每当服务业集聚度提升1个单位,服务业劳动生产率会同步提升大约1.58个单位。而且服务业劳动生产率的一期滞后值对本期劳动生产率的影响显著为正。从式(3)和式(4)的对比可知,不同行业的产业集聚对劳动生产率的影响是不同的,但就本专题的研究而言,工业和服务业的集聚对这两个部门的劳动生产率都会产生显著的正向影响,虽然工业部门集聚产生的劳动生产率效应要高于服务业部门。
式(5)的估计结果显示,非农产业集聚对非农产业的劳动生产率会产生显著的正向影响:每当非农产业集聚度提升1个单位,非农劳动生产率会同步提升大约3.36个单位。但非农产业劳动生产率的一期滞后值对本期劳动生产率的影响不显著为正。
总的来看,本专题的实证研究结果符合前面所描述的产业集聚对劳动生产率影响三类观点中的第二类观点。