包含叛逃：探索忠诚与背叛之间的灰色地带的词条

　　编者按：

　　在30余年的时间里，宏观经济学已经开始倒退。宏观经济理论大家们装作不知道“货币政策收紧可能会导致经济衰退”这样简单的论断而无视不争的事实。他们构建的模型将宏观经济总体变量的波动归因于假想出来的因果力量，纽约大学斯特恩商学院经济学教授、世界银行首席经济学家保罗·罗默在本文中嘲讽了这些想象中的破坏力。罗默认为，这些宏观经济学家所言与事实不相一致并不那么严重，真正严重的问题是其他经济学家并不关心这些宏观研究者不理会现实的状况，对显而易见的错误漠不关心。罗默指出，一律包容比坚定地拥护错误对科学的腐蚀更严重。

　　作者：保罗·罗默 / 纽约大学斯特恩商学院经济学教授、世界银行首席经济学家

导读

　　1970年代末，当凯恩斯主义旧有的确定性失灵时，新一代经济学家们将这门学科变成了一堆超级抽象的数学方程式。他们假设，经济系统将趋于均衡态，只有来自系统外部的不可预测的冲击能干扰这种均衡。由于冲击起于外部，经济学家们为了让数学模型看起来合理，不得不发挥想象，猜测这些冲击到底是什么。

　　而罗默在《宏观经济学的困境》（The Trouble with Macroeconomics)中嘲讽了这些想象中的破坏力。他将由此产生的宏观经济理论，比作只有当“巨魔、小鬼和以太（物理学家假想的物质）”存在才解释得通的物理学。

摘要

　　在30余年的时间里，宏观经济学已经开始倒退了。目前，对于识别问题的处理并没有比20世纪70年代早期有所进步，（经济学家们）因其晦涩难懂而逃避这个问题的挑战。宏观经济理论大家们装作不知道“货币政策收紧可能会导致经济衰退”这样简单的论断而无视不争的事实。他们构建的模型将宏观经济总体变量的波动归因于假想出来的因果力量，而那些因素并不会被人们的行为所影响。类比于物理学中的弦理论,我们知道当对权威人士的尊敬演变为盲从而不再以客观事实作为研究科学真相的决定因素时便会导致科学研究模式的普遍失败。

包含叛逃：探索忠诚与背叛之间的灰色地带的词条

　　李·斯莫林在《物理学的困境》（2007）一文开篇写道，他的职业生涯仅跨越了物理学历史的25个年头，但期间该领域在的核心问题上并没有任何进展。这一问题在宏观经济领域更加严重，我已经见证了30余年的倒退。

　　在20世纪60年代和70年代早期，很多的宏观经济学并不关心识别问题。他们没有意识到通过对联立方程变量的观察来得到对因果关系的可靠推断是很困难的。直到20世纪70年代末,他们才意识到这一问题的重要性，但正如Canova和Sala在最近一篇论文标题中所标示的那样，我们又重新“退回到了起点”。目前的宏观经济模型使用不可思议的确定性假设来得到那些令人困惑的结论。为了更真切地体会这些奇怪的结论，我们来看2010年一位顶级宏观经济学家所发表的论文中写到的内容:

　　从信息公开的角度来讲，我必须承认，我自己都不是完全确信货币除了会导致通货膨胀之外还有什么重要的。

　　事实

　　如果你想要检验货币政策是否真的无关紧要，可以考虑观察沃尔克通货紧缩（Volcker Deflation，小编注：Paul Volcker是第十二届美联储主席，以降低通货膨胀率和维持物价稳定出名）。回想一下，美联储可以通过买卖债券来直接控制基础货币，它等于通货加上银行准备金。

　　下图1的上半部分描绘了大约20年内基础货币与CPI指数的年度数据，下半部分则是沃尔克通货紧缩。在上半部分中实线是基础货币，位于实线下方的虚线是CPI指数，两者都选定 1960年为基年，数值标准化为1，且每向上移动一个单表示数值增减1倍。图中，CPI指数的斜率即为通货膨胀率。

　　在下半部分图中，长虚线所表示的数值可以帮助我们对每年的通货膨胀率变化有更细致的了解。短虚线刻画了沃尔克通货紧缩前后通货膨胀率的线性趋势。我在上下两部分图中用阴影区域表示NBER的经济周期紧缩，并用深色来突出这两次萧条——沃尔克紧缩。很明显，在上下两幅图中，沃尔克紧缩前后通货膨胀率的数值与变化趋势都发生了剧烈的改变。当一家银行向另一家借入准备金时，它需要支付名义的联邦基金利率。如果美联储的准备金紧缺，那么利率就会上升，而货币政策最好的指标是实际利率，它等于名义利率减去通货膨胀率。沃尔克担任美联储主席期间的实际利率比战后任一时期都要高。

　　在沃尔克任期内的两个月中，沃尔克采取非常措施，公开宣布美联储将改变它的操作流程。本次改变正是Romer夫妇于1989年总结美联储内部讨论后引致的。美联储的官员们寄希望于本次改变能够抬升联邦基金利率并抑制经济中的通胀压力。

　　图1 1960—2000年的货币、价格变动

　　下图2刻画了以1979年8月（沃尔克开始就职美联储主席）为0点的各项经济数据。实线代表的真实利率从0附近上升至5%，之后保持相对稳定。将实际利率从名义利率中减去后得到的通货膨胀率用红色的点线表示。黑色的虚线代表失业率，与GDP相同，均采用月度数据。(深色区域同样为两次衰退。)在第一次萧条中，产出下降了2.2%，失业率从6.3%上升至7.8%;第二次萧条中，产出下降了2.9%，失业从7.2%上升至10.8%。

　　正如美联储的官员们所希望的那样，图2中的数据为这两次萧条提供了一个简明的解释:

　　（1）美联储以名义利率为目标，除第一次萧条外，名义利率比普遍的通货膨胀率要高大约500个BP。

　　（2）实际利率升高会抬高失业率，降低产出。

　　（3）通货膨胀率下降可能是因为高失业率伴随着巨大的产出下降缺口，或者是因为美联储的行为改变了预期。

　　图2 沃尔克通货紧缩

　　如果美联储可以改变利率达500个BP，货币政策是否重要就无需赘言了。当然，对于图2中的数据，唯一能够使人继续坚信货币政策是不重要的就是认为无论美联储的官员们怎么想，他们都不会影响到利率水平，利率之所以会变化是因为恰巧在这一时刻受到了某一外部冲击，使得美联储误以为是他们自己带来的改变。

　　据我所知，没有任何一个经济学家认为是某个假想的外部力量导致了沃尔克任职期间实际利率的上升，但有很多的模型在为这一观点背书。

　　后现实模型

　　在基德兰德(Kydland)和普莱斯考特(Prescott)提出真实经济周期(RBC)模型后，宏观经济学家们不加怀疑地认为宏观经济总量的波动是由某个假想的冲击导致的，而非人们采取的行为。RBC模型依赖于两个恒等式。第一个等式将增长核算指标定义为产出(Y)的增长与投入(X)增长的差值：

　　阿布拉莫维茨(Abromovitz)在1956年创造性地提出了这一指标，为表示对他的敬意，我们称变量A为“燃素”。

　　第二个恒等式是货币数量方程，定义货币的流通速度v为名义产出(实际产出Y与价格水平P的乘积)和货币数量M的比值：

　　真实经济周期模型将衰退归因于为“燃素”外生性地减少。给定产出Y，货币总量M变化的唯一影响就是价格水平P的同比例变化。在这一模型中，正如Prescott在明尼苏达大学教授研究生课程时讲到的“邮政经济学要比货币主义经济学更接近理解经济的本质”，货币政策的作用微乎其微。

　　RBC模型的支持者们将这一模型的微观基础作为其主要优势。但这也提出了一个问题，因为并没有确切的微观证据表明这一模型引入了负向的燃素冲击或者是它所带来的理论影响。

　　在一封私人信件中，有人与Prescott相同，寄给了我一份明细账户帮我理解“负向的技术冲击”：

　　EdPrescott邀请我作他学生口试的第二考官......我虽没有见过但不怀疑他在校准练习等这些方面做的工作。我认为它没有太大意义表现在很多方面，比如说科学价值。于是，随着学生展示的进行，我试图将它们都整理出来。当轮到我来问问题的时候，我问道‘这些技术冲击是什么’。

　　EdPrescott十分紧张就像是当了一颗子弹。尴尬的4，5秒之后，他大声喊道‘他们就像是交通拥堵一样’(当天下午我们在房间里看到桥上发生了交通拥堵，这座桥在几十年后倒塌了)显然，如果他能够对他所提出的概念有一个更加合理的解释，我会认真去听......

　　我通过引用这段话想真正说明的是如果有人能够认真地为宏观研究加入微观基础，那将势必改善这一几近停滞的理论研究。设想一下一个经济学家只能将宏观经济的波动比喻为交通拥堵或其它一些字面上的原因。显然，继续发展的方向便是观察司机决定何时以及怎样驾车前进。通过做出这些决定就会产生总体交通量的波动。这与那些过去的理论是完全不同的，之前的理论只是假象某个外部冲击的存在，而事实上这些冲击并不是人们采取某种行为所导致的。

　　为了响应“外部冲击只是假象出来的”的这一观点，一位不知名的权威人士引用米尔顿·弗里德曼(1953)关于方法论的断言来予以反驳“理论越有意义，前提假设就会越不切实际”。近来，“所有的模型都是错的”似乎成为了一种潮流，它们忽略掉一切与模型不一致的事实。

　　从DSGE延伸到RBC核心

　　3.1 更多假想冲击

　　一旦宏观经济学家得出结论说调用一个假想的强制变量是合理的，他们就会增加更多。我给了一些变量名字，列举如下:

　　普通的phlogiston(燃素)，会增加在给定的投入下消费品的数量

　　特定投资的phlogiston(燃素)，会增加在给定的投入下资本品的数量

　　troll(巨魔)，可以随机改变支付给所有工人的薪水

　　gremlin(小鬼)，可以随机改变产出的价格

　　arther(以太)，能增加投资者的风险偏好

　　caloric(热量)，能让人们想要更少的闲暇

　　因为phlogiston可能会有特例，建模人员假定没有办法直接测定他们。phlogiston可以通过增长核算，至少在原则上如此。在实践中，计算的残差对投入利用率的误测非常敏感，所以即使在这种情况下，直接测量也是经常被忽略的。

　　3.2 价格粘性

　　为了使货币政策产生作用的可能性存在，实证的DSGE模型将价格粘性运用到RBC中。价格粘性扩展开来，允许货币政策影响产出，但是模型报告的结果从来没有从RBC教条走远。如果货币政策有影响，它的影响也是非常小的。

　　正如我稍后会展示的，当模型中变量的数量增加时，识别问题会变得更糟糕。在实践中，这意味着在估计模型时，计量经济学家在决定可能出现的结果时更加灵活。

　　识别问题意味着为了得到结果，计量经济学家需要在同步系统变量数据以外的事情上下功夫。我将参考FWUTV(facts with unknown truth value，事实未知真实值)来强调，尽管估计过程把FWUTV看做是已知正确的事实，模型估计的过程仍然没有揭示关于真实值的任何事情。目前在DSGE的计量实践中，一些做法是通过“校准”某些参数的值以及贝叶斯先验得到FWUTV。正如Olivier Blanchard(2016)在他经典保守的陈述中所说的:“在很多情况下，对严格先验的辩解在最佳估计中也是很弱的，所估计出的结果更多的反映的是研究者的先验而不是似然函数。”

　　这比听起来问题更多。对一个参数的事先指定，能够对其他的参数的结果产生决定性的影响。这意味着计量经济学家可以从那些看起来不那么重要的参数中，找到一些参数，使他们感兴趣的参数产生期望的结果。

　　3.3 一个例子

　　Smets和Wouters模型(SW模型)被誉为DSGE计量中突破性的成功。当他们将多年的美国数据运用到这个模型中时，Smets和Wouters(2007)得出结论:

　　货币政策冲击在所有范围的产出的预测方差中只占了很小一部分(599页)。

　　货币政策冲击在通胀的波动性中只占很小的一部分(599页)。

　　(在解释产出和通胀的相关性时)货币政策冲击影响不大有两个原因，第一是它只占通胀和产出发展的很小一部分(601页)。

　　模型中重要的不是货币，而是假想力量。这就是这些作者想表达的，我仅仅用一些粗体和“亦称为”做了一些修改。

　　需求冲击例如aether(亦称为风险溢价)、外生性支出、特定投资的phlogiston(亦称为技术冲击)，很显著的解释了产出的短期预测方差、troll的工资上涨(或者caloric，亦称为劳动力供给)，并且，在很小的程度上，特定产出的phlogiston(亦称为技术冲击)很大程度上揭示了中长期运行中的差异。......第三，通货膨胀的发展，短期受gremlin的价格上升冲击驱动，长期受troll的工资上升驱动。

　　在随后的论文注释中(Linde，Smets，Wouters2016，脚注16)，他们强调了假想驱动带来post-real宏观经济学的灵活性(我再次用粗体注释):

　　gremlin的价格和troll的工资上升在解释SW模型中的通胀和实际工资行为中起到了重要的作用，这种说法被Chari，Kehoe和McGrattan(2009)批判为是不合理的。然而，Smets和Wouters(2011)证明了上升带来冲击的幅度可以通过caloric(亦称为偏好)冲击家庭偏好显著减小。

图3 一个假想的劳动力市场

　　识别问题

　　4.1 供求模型中的识别

　　考虑关于识别的问题时往往起步于供给曲线和需求曲线的分析。设想我们有图3中的数据，纵轴是工资W(取对数)，横轴是工作时间L(取对数)。为了测某一政策变动所带来的影响，经济学家需要知道劳动力供给曲线的弹性。这里，识别问题指的就是无法单从散点图中计算得到弹性。

　　为了描绘图中的数据点，我将借助供给和需求曲线来介绍数据的生成过程:数据的对数值加上一些随机扰动。接着便利用这些数据来寻找逼近曲线。模型利用的是线性的供求曲线以及独立偏误，利用数据来分别计算截距和斜率。

　　下一步，我通过对模型引入限制:垂直的供给曲线，来刻画一个未知的真实值(FWUTV)(具体来说，你并不清楚这一限制的真实值，因为我还没有告诉你我用于生成这些数据和曲线的真实情况)。通过这一设定，软件将计算得到一条蓝色的实线(在图3的下半部分)。普遍的用法是，如果软件不报错，那么这个模型就是可识别的。

　　接下来，我加入一个新的FWUTV，引入限制:供给曲线经过原点。软件一样没有报错，模型是可以识别的。结果在图3的下半部分中以红色线标识。

　　你可能并不知道这两个FWUTV哪一个是正确的，但至少有一个是错的，而且软件计算出的结果也并不会告诉你哪一个可能是错的。因此，在没有其它信息的条件下，以“软件是否会报错”作为评判模型是否可识别，进而计算供给和需求全线弹性的做法是毫无意义的。

　　4.2 ㎡测度问题

　　假定X是m阶向量，我们可以构建如下的线性联立方程模型：

　　其中，矩阵S对角线上的数据都是0，因此，等式表明X的每一分量都等于其余部分的线性组合加上一个常数项和一个随机项。简单起见，我们假定随机项在每一期都是相互独立的。同时，假定X的各个分量都不是其它分量的滞后值。因为矩阵S有m(m-1)个参数(对角线上的数值为0)，常数项c中有m个相同参数，可见，等式中共有2个参数有待估计。

　　随机项中可能包含了被我们忽略掉的某些因素可能会影响到模型中的变量。因此并不能够假设向量X中各个分量对应的随机成分之间是不相关的。(在图3中我同样通过加入随机项成分之间不相关这一FWUTV来生成曲线。)这意味着关于X的方差-协方差矩阵预测值的所有信息要被用来计算扰动参数ε的方差-协方差矩阵。

包含叛逃：探索忠诚与背叛之间的灰色地带的词条

　　可见，在这一模型中，通过m个等式需要得到2个待估参数，这等价于加入μ(x)(X的预测值)和x拔，表示X的平均值。

　　在Smets-Wouters模型中，有7个变量，7个等式和49个待估参数。因此就需要加入42个FWUTV才能防止计算软件报错。

　　4.3 加入预期使得识别问题更为严重

　　在对传统凯恩斯模型的批判中，Lucas and Sargent（1979）认为通过加入理性预期和一系列的交叉方程限制可以解决识别问题。

　　为了说明当加入预期作为决策的影响因素时会产生什么样的效果，我们假定预期工资独立于即时工资，将对劳动供给产生影响，因为预期工资将会影响到人们是否进入当前的劳动力市场。为了衡量这一影响，劳动力供给等式中就必须包含预期工资这一项，我们记为μ（w）。

　　将模型一般化，我们可以在之前的线性模型中加入另外一个m阶方阵B去度量μ（x）的影响：

　　同理，关于x拔（x的平均值）存在如下略微不同的等式：

　　同样是m个等式，但现在需要计算之前两倍的待估参数——2个。对于一个有7个变量的方程就意味着有2?72?7=91个待估参数。

　　除此之外，由于没有关于参数、误差项分布的改变，x的期望值会是常数。因此，尽管有x的多个观察值以及S中的斜率系数，仍然无法从Bμ（x）得到常数项C。

　　可见，加入预期因素后会导致识别问题更加严重，正如Sims（1980）写道“我个人认为，加入预期因素会比当前更严重地影响识别。”Sims的论文到目前依然很有意义，在文章前面他提到，在模型中参数的数量需要被压缩；同时，他认为无法从预期中分离得到常数项的观点是Solow（1974）提出的。

　　识别问题处理中的回归

　　5.1 自然实验

　　后现实宏观经济学家仍然没有对Lucas和Sargent（1979）提出的识别问题给予足够的重视。他们仍然依赖于FWUTV。他们所做的一切似乎都只是找寻一些新的方法来传入FWUTV。

　　面对在供给和需求市场里估计劳动力需求弹性的挑战，Friedman和Schwartz（1963）的方法是找在时间上相邻的两个时期，且这两个时期条件非常相似，除了一个时期相对于另一个，劳动供给曲线移动的变化。为发现满足条件的这样一对数据，他们仔细查看了历史证据，将这些信息添加到散点图中。

　　如果历史条件下提供这样的一对数据，他们会忽略所有其他数据点并只基于这一对来进行估计。如果Lucas和Sargent是正确的——识别问题是实证宏观经济学中最重要的问题，那么剔除数据是有道理的。毕竟标准差更大但有意义的估计要好过有一个毫无意义的标准差小的估计。

　　在Friedman和Schwartz的方法提供有真价值的事实，别人可以评估。这允许对证据的累积性科学分析。当然，允许累积性科学分析意味着你的结果面临许多批评和修订。

　　当我在读研究生，Friedman和Schwartz声称增加准备金的要求，造成了1938-1939的经济衰退，这给我留下了深刻印象。Romer和Romer（1989）挑战这段历史和大萧条后其他几个时段的解读。他们认为的最可靠的识别信息来自于战后时期，尤其是沃尔克通货紧缩。据我估计，货币政策对美国产出的影响很大程度上依赖于最干净的实验——沃尔克通货紧缩。

　　5.2 假设识别

　　当凯恩斯宏观经济建模中增加变量数目，他们便撞进了从m个方程中估计m2个参数的问题。他们的回应是FWUTV作为许多参数的值，主要是将其设定为等于零。正如Lucas和Sargent指出，在很多情况下，没有独立的证据能检查评估这些FWUTV的真正价值。但是对于他们来说，凯恩斯模型建造者清晰展示了他们的所作所为。

　　5.3 识别演绎

　　Lucas和Sargent（1979）提供的解决识别问题的关键部分，似乎是数学推导会在同时进行的系统中牵制某些参数。但解决识别问题是指事实有可以被评估的真值，但数学不能建立事实的真值。从来没有，也永远不会。

　　在实践中，数学确实是让宏观经济学家把FWUTV定位到更远离识别的讨论。凯恩斯主义者倾向于说“假设P是真的。然后该模型被确定。“依托微观基础让作者可以说，“假设A，假设B，...等等等等....等等，我们已经证明，P是正确的。然后该模型被确定。”

　　为了说明这个过程在劳动力市场例子的情境中只用足够的“等等等等”，显示这是如何演变，想象一个代表性代理从消费产出中获得收益与上班的负效用。劳动负效用取决于由随机变量γ捕获以太的波动水平。

　　输出的生产技术Y=πAL是劳动时间（燃素的普遍水平）的产品，π，和常数A。社会计划者的问题是：

　　为了得到一个劳动供给曲线和劳动力需求曲线，分成两个单独的由工资W连接的最大化问题：

　　接下来，关于虚拟随机变量的一些分布假设，γ和π。具体地，假定它们是log正态，log（γ）?N（0;σγ）和log（π）?N（0;σπ）。进行一些代数后，这一最大化问题的两个一阶条件减少到这些联立方程。

　　其中

　　此系统有一个标准的，恒定弹性的劳动力需求曲线，仿佛有只一种无形的手，劳动供给曲线截距等于零。

　　有了足够的数学，作者可以相信，大多数读者永远不会知道FWUTV被埋没在哪。一名讨论或裁判不能说识别假设是不可信的，如果他们无法弄清楚它是什么，会太不好意思问。

　　在这个例子中，FWUTV是log（γ）的平均值为零。关于误差项的分布式假设是埋东西的好地方，因为几乎没有人关注他们。此外，如果一个批评家没有看到这是确定假设，她怎么能赢得关于参数醚真实期望值高低的争论?如果作者能构造一个虚构的变量，“因为我这么说”，似乎像一个任何关于其性质问题的非常有说服力的答案。

　　5.4 识别的混淆

　　我从未理解识别是怎样在现有的实验性动态随机一般均衡模型中被实现的。在某种程度上，通过之前部分所解释的推演，他们依赖于识别的类型。他们同样依赖于由识别假设所重新命名而来的校准。但是我从不知道是否存在其他FWUTV的隐藏之处。没有探讨识别问题。例如，在斯梅特和伍特斯(2007年)的文章中，既没有“识别出”也没有“识别”出现。

　　为了从那个模型中复制结果，我阅读了作者所使用的名为Dynare的软件包的使用指南。在列举贝叶斯法的优点的部分，使用指南指明：

　　“第三，先验的包含同样帮助识别参数(第78页)。这是一种启示。贝叶斯法意味着你的软件从不会运作不灵(显示警告信号)。”

　　回顾过去，这点本应是容易被发现的。我用供应曲线截距为零作为FWUTV的限制，去形成图3中的细长曲线。这就像在为零的截距上放一个非常紧绷的先验。如果我把这个先验放宽一点并用计算出的贝叶斯估值取代最大相似估值，我应该得出一个几乎相同的需求弹性值。

　　如果我这样做，贝叶斯法将显示供应曲线截距的后验接近于我所输入的先验分布。所以用专业术语来说，我可以说“这些数据并不能提供关于供应曲线截距值的相关信息。”但是之后我可以说：“需求曲线的斜率有一个不同于先验的后验。”通过缺省，读者可能推断出它是数据，正如似然函数获取的，这是需求曲线弹性的资料，而实际上它是先于供给曲线的截距，是固定下来产生的紧后。通过改变我为供应曲线所输入的先验，我可以一直改变需求弹性的后验，直到我得出一个我想要的数值。

　　先验是FWUTV的矢量对我来说是个新闻，但是一旦我理解并开始仔细得阅读，我意识到那是一个计量经济学家们之间公开的秘密。在我在介绍中标注了标题的那篇文章中，卡诺瓦和Sala(2009年)写道：

　　“不加批判地利用贝叶斯方法，包括采用先验分布，不真实地反映扩散的不确定性，可能隐藏识别的病症。”

　　Onatski和威廉姆斯(2010)表明，如果你把不同的先验加到Smets和Wooters模型的早期版本(2003年)，你会得到不同的结构估计。Iskrev(2010)和Komunjer和Ng(2011)指出，未经任何先验信息时，Smets和Wooter模式没有确定。Reicher(2015)回应在他关于Hatanaka(1975)的结果的讨论中模拟提出的点。鲍迈斯特和汉密尔顿(2015)指出，在使用贝叶斯方法估计的供给和需求市场的二元向量自回归中，这是很有可能的“即使一个人可用无限样本的数据，对需求弹性的任何推论仅来自于先验分布"。

　　关于经济学者和物理学者们的问题

　　从关于经济学者们如何尝试去解决标准的宏观问题的元问题中分离出像美联储是否可以增加联储基金利率这样的标准宏观问题是有帮助的。元问题的一个例子可以是为什么宏观经济学者们开始援引虚拟的驱动力以解释波动现象。另外一个例子是为什么他们似乎会忘记那些已经被发现的鉴别问题。

　　我发现一个更有启发性的问题是为什么粒子物理学中弦理论学者们的特征跟后真实宏观经济学者们的特征会有如此显著的相似之处。为了解释此相似之处，我将列出Smolin在其第十六章中提到的弦物理学者们的七个不同特征的列表：

　　（1）惊人的自信

　　（2）一个异常统一的群体

　　（3）一种类似于对宗教信仰或者政治纲领的认同的对群组的认同感

　　（4）一种存在于本组与其他专家之间的强烈的界限感

　　（5）一种对非本组专家的想法，意见以及工作的漠视与不关心

　　（6）有一种理想化地解释证据，相信夸大的或者不完全的陈述，并且漠视理论错误的可能性的倾向

　　（7）缺少对一个研究项目应该涉及风险的程度的鉴别

　　这些相似之处所暗示的推论是弦理论学者以及后真实宏观经济学者们的发展都解释了一种依赖数学理论的科学领域的普遍的失败模式。这种失败的条件会出现在当一些有才能的研究者们因在数学建模的前沿有真实的贡献而被尊重的时候。钦佩发展成对这些领导者的顺从。顺从导致努力沿着领导们所推荐的特定路线。因为来自于授权的引导能够调整很多研究者的努力方向，符合事实不再被作为一个协调装置而被需要。结果，如果事实与官方认可的愿景不一致，他们就被列为次要地位。最终，证据不再是相关的。该领域的进展被纯粹的数学理论所判定，正如被权威所决定。

　　一件令人惊讶的事是在Smolin的描述中他对弦理论学家所提出的理由的驳回。弦理论学者们说他们之所以没有考虑数据是因为在弦理论所考虑的规模下没有可行的收集数据的方法。他做出的有说服力的情况是有很多未被解释的事实是学者们本可以解释的，如果他们曾想去解释(第十三章)。在物理学中就像在宏观经济学中一样，对事实的漠视不得不被理解为一种选择。

　　Smolin的论点近乎完美得契合Mario Bunge于1984年提出的集体人类努力的分类学。该分类学从区分“研究”领域和“信仰”领域着手。在像数学，科学和技术这些研究领域，对整理的追求是调整机制。像在宗教和政治活动这些信仰领域，权威协调着组员的努力方向。

　　权威对于协调并没有固有的坏处。有些时候并没有别的选择。废除主义者行动是依赖于权威去做出是否其组员应视囚犯的监禁为奴役的决定的信仰领域。一些权威不得不做出决策因为并没有组员可以独立得用来解决此问题的逻辑论点和事实。

　　在Mario Bunge的分类学中，伪科学是声称为科学的信仰领域里的一种特殊种类。这是危险的因为持续的研究领域规范和信仰领域规范是不同的。因为规范通过社交扩散，混在科学家中的伪科学者们会破坏需要依赖于科学而幸存的规范。受人尊敬的个体在形成一个领域的规范中尤为重要，尤其是作为一个带领新成员加入一个领域的导师的角色。因此，有效的科学的防卫会坚持最受尊崇的个体和最高的科学行为标准。

　　忠诚会侵蚀科学的准则

　　科学失败模式的描述不应该被认为意味着科学在某人被自身利益所激励的时候产生。人们总是被自身利益所激励。如果科学要求其参与者成为无私的圣人，那么它将不可能幸存。

　　就像市场一样，科学是一个通过竞争来将个人的自身利益导向团体的利益的社会系统。问题是在科学中的竞争，就想在市场中的竞争，容易受到勾结的侵害。BobLucas，EdPrescott，以及TomSargent引领了后现实宏观经济学。在1980年前，他们为宏观经济学理论作出了重要科学贡献。当这些贡献遭受尖刻的，不屑的和刚愎自用的回击时他们共享了“避弹坑”。结果，他们发展出了一种在很多社交情境中都令人倾佩的的和有效率的忠诚关系。

　　下面两个例子可以解释关忠诚能引进科学的偏见。

　　7.1 案例一：Lucas支持Prescott

　　在2003年的对美国经济协会的演说中，Lucas对Prescott的货币经济学是的琐屑的声称给予了强硬的支持。

　　这个态度很难与Lucas在1995年的诺贝尔演讲相一致，该演讲对货币经济学是重要的原因给出了细致入微的探讨以及提出了其对宏观经济学造成的学术性挑战。这同样与他在Ball和Mankiw的文章中的评论(Lucas，1993年，第153页)不一致，在该文章中Lucas写道Cochrane提出：“几乎不能说坚定地创建关于货币不稳定性的重要性与其真实影响的性质的一个精确的观点，至少在美国的战后时期。”

　　Cochrane注解道：如果货币有他在风险价值提出的系统性的影响，研究这样作为最后贷款人角色的货币政策以及作为存款保险的货币协会就变得更加重要。根据科克伦的研究(1993年，第331页)，如果该评估提议极小的利益，那么“并不是答案是错误的，我们或许只是正被简单地问及错误的问题。”

　　然而，Lucas(2003年，第11页)考虑了让货币政策更为可预测的影响并总结出潜在收益确实很小，大约是消费的百分之一的数百分之一。

　　在他的一个发表于2013年的论文集的介绍中，写着他在2003年提出的结论是在战后时期的美国，货币因素并不是“该时期真正不稳定的一个主要原因，不是他们不是重要的也不是他们永远不会是重要的。我与Friedman和Schwartz在收缩时期共享了这些观点，从1929至1933年，大萧条时期，并且这也是我看待现在的衰退的后雷曼2008至2009年阶段的方式”(Lucas2013年，第xxiv页，原版中为斜体)。事实上，他对科克伦的观点做出了退让与让步，去研究美联储作为最后贷款者的角色本应该更为重要。

　　Lucas(2003年)也冒险支持了普莱斯考特于1986年计算出的的百分之84的输出变量是由于燃素技术股造成的，尽管科克伦也指出结果显示关于此估值的T统计值为1.2，所以通常的两个标准误差置信区间包含了整个范围的可能值，[0%；100%]。事实上，Cochrane指出通过其他方式尝试去计算这个分数的经济学者们得出的估值从填满普莱斯考特估值范围的大约80%下降到了0.003%，0.002%和0%。

　　我能得出的对于Lucas在他2003年演说时所做出的强硬声称相对于他在演说前后所写的唯一可能解释是，他在尽最大可能的支持他的朋友Prescott。

　　7.2 案例二：Sargent支持Lucas

　　第二个超出科学呼唤的论点的例子是Tom Sargent对Lucas(1980年)所写的货币数量论的防卫。在这篇写于1980年的文章中，Lucas估计出名义货币的需求并发现它和物价水平是成比例的，正如货币数量论所预测的。他发现一种能在他所考虑的特定的美国数据样本过滤数据以获取数量学结果的方法并且似乎总结出无论什么鉴别假设被建立进他的过滤器都一定是正确的，因为出来的结果支持了数量论。Whiteman(1984年)表明了怎样去明确地得出对于Lucas所用的过滤器来说那些鉴别假设是什么。

　　Sargent和Surico(2011年)重新使用了Lucas的方法并发现在沃尔克通货紧缩后应用，他的方法得出一个非常不同的结果。他们表明变化会在货币供给过程的变化中产生。

　　在这一点上，他们离开他们的方式去以最大程度赞成的措辞去描绘Lucas1980年的文章。Lucas写道他的结果可能被作为“一种度量通货膨胀和战后时期的利率的程度的方法能根据纯粹经典的，货币力量被理解(Lucas，1980年，第1005页)。Sargent和Surico给予这句话以“Lucas的目的是精确地表明出他的结果取决于其在1953至1977年间货币供应过程的维持中的幸存”的难以置信的解释(第110页)。

　　他们同样曲解了Lucas做出的存在数量学可能失败的条件的评论的意义。从文中可以清楚地了解到Lucas表明的是数量论将不支持他的过滤方法所清除的高频变化。而并不是像Sargent和Surico所说的，一个如果美联储采用不同的货币供应规则，过滤法将得出不同的结果的警告。

　　描述他们的结果的最简单的方法是应用Lucas的评估器时，在货币需求中的价格水平指数(在它对真是参数得出一致的评估的意义上)仅仅在货币供应的局限的假设下被鉴别。Sargent和Surico并没有这样表述。实际上，他们从未提及鉴别，尽管他们预期他们自己的动态随机一般均衡模型可以运行政策调控实验以及质疑“如果货币供应规则改变会发生什么?”他们说他们依赖贝叶斯估计法并且像往常一样，几个参数紧前验后已经是非常相似的。

　　尤其，我怀疑在这个可选择的情境中，他本应对某人(可能是一个参考者)提出的关于鉴别的问题提供推脱的回应：

　　此外，像那个我们正在运用的模型一样，动态随机一般均衡模型是特意被设计成一种运用Lucas(1972年)和Sargent(1971年)主张的来自合理预期模型方式的交叉方程的限制的装置，用来解释包括通货膨胀的经济衰退是怎样依赖于货币与财政政策的。我们认为我们正在以一种他的设计者所打算的方式运用我们的结构模型(第110页)。

　　当Lucas和Sargent(1979年，第52页)写下“从一系列经济时间段中鉴别结构模型是必须被任何要求提供量化经济装置的人解决的问题”这句话时，他们所说的任何人意味着在让他们拒绝去回答关于鉴别的问题这方面，没人拿到及格。没人去说“我们知道我们在做什么。”

　　回到起点

　　我同意Lucas和Sargent(1979)激烈的论断“目前大型凯恩斯宏观模型所基于的识别假设是不可信的。”目前这一问题更加严重，宏观模型的假设不仅不可信而且更加不透明。

　　Lucas和Sargent对那些凯恩斯模型得出的预测有激烈论断，我也深表赞同。那些模型认为通货膨胀率上升将会导致失业率下降。但Lucas(2003)对于事实的断言失败得更加明显：

　　“我的理论认为宏观经济学按其本意来讲已经成功了：它的核心问题是要防止经济陷入萧条，这已经得到了解决，事实上它已在数十年前就被解决(p1)”

　　将全世界产出减少作为衡量标准，2008-2009年的金融危机显然证明Lucas对于宏观经济的预测远比那些凯恩斯模型多得到的结论离谱得多。

　　Lucas和Sargent对于凯恩斯宏观经济模型的论断适用于后现实宏观模型以及它们的生成范式：

　　“那些预测普遍是错误的以及它们的理论基石也是充满瑕疵的......目前经济周期的学生们面临的主要任务就是整理这些理论残骸”(Lucas和Sargent，1979，p.49)

　　元模型

　　在对当前宏观经济学的评论中，我对它的消极看法——认为它甚至退化为了一门伪科学，显然是少数极端的一个。绝大多数的评论承认宏观经济学还有亟待提高的地方，但也认可了它持续取得的进步，至少按照后现实的衡量标准，它采用了越发复杂的分析工具。一个自然的问题是为什么很少会有人像我一样指出它的不足，而我的观点就像是一个异常值一样被大家所忽视。

　　模型可以将我为什么会做出不同的选择追溯到不同的偏好、不同的价格以及不同的信息。我和其他人一样，看着相同的论文，参与着相同的讨论，所以信息不对称的问题就不需要考虑了。

　　当一个人敢于说出那些听起来似乎是错误的言论时，他便具有了Smolin所具有的一些受人尊敬的特质，付出的代价便是大量的反对之声。这个成本对于我来说相对较低，因为我不再是一名学者，而是一名从业者，我希望能够将有用的知识服务于实践。我对于是否能够在顶级期刊杂志发文或者获得某些荣誉还不关心，因为这些对于实现我的人生目标毫无价值。那些威胁对于具有Smolin品质的人们来说不起任何作用。

　　9.1 科学的规范

　　一些经济学家会在私人场合同意当下宏观经济学的现状，但到了公众场合又闭口不言。这与他们在不同场合下的成本不同有关。然而，他们中有些人还会公开反驳我，这可能就需要一些其它的解释了。

　　当然，他们可能觉得看到对权威的批评同样很不舒服，要付出一定的成本。毫无疑问这样的情绪很强烈。在我批评了Lucas的一篇论文后，我碰到一个人都气得说不出话来。最后，他只和我说了一句：“你在杀害Bob”。

　　但是我认为逃避会让问题更加严重。一些经济学家似乎已经被那些后现实宏观经济学家同化，认为公开批评权威是极大的不敬，而且无论是与现实不符、结论错误抑或是模型没有意义都丝毫不值得担心。

　　将权威至于批评之上的范式可以帮助人们相互团结，但这可能更加适合在政治、道德或者宗教领域。正如Jonathan Haidt(2012)所说的，这样的范式有存在的价值，因为这可以帮助他们团结起来一同抵御来自另外一个团体的攻击。它由两种固有的道德意识所支撑，其一是鼓励服从权威，另外一个则是牺牲自己去守卫神圣的纯洁。

　　科学及其它研究领域诞生于启蒙运动以及对那些固有的道德意识的舍弃。他们相信任何东西都不是神圣不可侵犯的，权威应当不断被挑战和质疑。从这个角度讲，对于研究领域中基础知识的建设伏尔泰起到的作用要比笛卡尔和牛顿更加重要。

　　研究领域的人们信守着坚定的承诺，不依赖权威，去追求那尚不完善的真理，通过对公开事实和逻辑的独立评判形成粗略的共识。作出评判的人们清晰地陈述着自己的不同看法，同时也承认自己的错误，他们非常喜欢去挑战权威的观点，更不用说那些绝无错误的言论了。

　　即使真得这样做，科学也并不完美。准确的说，并不存在完美。科学家们在追求真理，但他们也同样意识到真理也许永远都无法完全被揭示。他们只是希望能够将真理的价值建立在观点上就像将股票市场的价值建立在公司上一样。可能在很长的一段时间，它会误入歧途。但最终它会被那些肆意挑战权威的狂热分子和致力于更好地解释现实的支持者们拉回到正轨。

　　尽管论据可能不够充分，但科学似乎更加善于生产有用的知识。整合众多人们的信念是一种独特的方式，也是唯一的方式去达成一种千万人之间的共识而不是采用威压的方式。

　　经济学未来的困境

　　一些经济学家反驳我的担忧，认为后现实宏观经济学是一潭死水，止步不前，但可以忽略，毕竟“有多少经济学家会认为紧缩的货币政策会对真实产出没有一点影响?”

　　对我而言，这恰恰揭露了一个认识盲区。宏观经济学家所言与事实不相一致并不那么严重，真正严重的问题是其他经济学家并不关心这些宏观研究者不理会现实的状况。对显而易见的错误漠不关心，一律包容比坚定地拥护错误对科学的腐蚀更严重。

　　那些在生涯早期就做出过卓越贡献的经济学家们遵循的轨迹将他们远离了科学。这样去说那些我认识和欣赏的人心理会很痛苦，令我同样难过的是我认识的其他很多人竟然还在疯狂追求着这些(远离了科学的)经济学家们。但只有科学和启蒙运动的精神是人类最重要的成就，远比我们的感受要重要的多。你可能不赞同我对科学的信仰，但你扪心自问：你会放心将你的孩子交付给一个反疫苗论者或者顺势医疗论者而非相信药理科学的医生吗?如果不的话，你又怎能期待那些只关心结论的人会持续关注经济学家，况且那些经济学家也清楚结论远比结论要重要。

　　很多人都很欣赏E.MForster的言论：对我来说，朋友比国家更重要。在我看来，如果他能改写为：“如果我必须在背叛朋友和背叛科学中做出选择的话，我希望我能有勇气选择背叛朋友。”这样就更好了。

　　文章来源：微信公众订阅号“金融炼金术”2016年10月9日（原文编译自https://paulromer.net/the-trouble-with-macro/，本文仅代表作者观点）

　　译者：康恒溢、屈宇、蔡菲莹、金亮辰、樊书琴