新書推薦:
《
古代中国与南亚文明论丛
》
售價:NT$
281.0
《
法医冷知识——尸体是一本无声的书,推理破案必知的92个冷知识 法医门徒 著
》
售價:NT$
305.0
《
东方园子:中国古典园林现代应用 园冶 禅庭 东方美学 造园 庭院造景施工 国风 作庭记 景观设计
》
售價:NT$
1469.0
《
Hygge Home(为什么我只想待在家)
》
售價:NT$
449.0
《
思想会·诺曼底1944:登陆日与史诗般的77天法国战役
》
售價:NT$
913.0
《
黄金定律:智慧泥板与巴比伦最富有的人(全球畅销书!来自古巴比伦的财富课,教你摆脱贫困,智慧管理财富,实现财富持续增长!)
》
售價:NT$
245.0
《
全球的全球史:世界各地的研究与实践 历史学的实践丛书
》
售價:NT$
408.0
《
学会思考 批判性思维 思辨与立场 学会提问
》
售價:NT$
403.0
|
編輯推薦: |
本书适合以下读者:一、想要进入因果推断领域的初学者,该书比市场上流行的主要教材门槛低,学习成本不高。二、适合已经会了一点因果推断,但是知其然不知其所以然的读者。这本书用一些例子、用一些非常生动鲜明的方式去讲授因果推断的方法和本质,对于会运行程序,会写文章,但对方法的本质理解不深的读者,这本书能够加深、修正和规范读者对方法的理解。三、适合想快速了解因果推断领域最新方法的读者。该书涵盖的方法最新最全,适合想了解工具变量方法、合成控制方法、面板数据等一些方法的最新进展的读者。
斯科特·坎宁安(Scott Cunningham) 的因果推断有以下优点: 涵盖范围和技术更新程度超越目前流行的因果推断著作。本书包含了最为前沿的各类因果识别方法,且包括了这些方法的最新进展,包含了合成控制法和因果图模型。作者从基础的概率与回归分析讲起,引出因果革命中最基础的两个分析工具——无向因果图和潜在分析框架。接下来分别介绍了目前主流的因果识别方法,分别是:匹配与分层方法,断点回归,工具变量,面板数据与双重差分法,合成控制法。以双重差分法(DID)为例,最近两年出现了一大批基于异质性处理效应的DID 估计,这些
|
內容簡介: |
本书是关于社会科学中因果关系确定方法的最新著作,其叙述风格尤其适合于经济学学生的学习。因果推断是当前国际学术界最热门的研究领域之一,是一种通过事物的原因推导至某个肯定结果的逻辑方式。本书介绍了社会科学家得以确定因果关系的主要数学工具和方法,是作者十多年研究和教学成果的结晶。内容包括:概率理论和统计回顾、回归的性质、有向无环图、因果模型的潜在结果、匹配和子分类、不连续回归、工具变量和面板数据、差分、综合控制。对于基本内容,作者在回顾基本的因果推理概念、概率与回归概念的基础上,介绍了有向无环图 (Directed Acyclic Graphs,DAG)、潜在结果因果模型 (Potential Outcomes Causal Model)、匹配 (Matching) 以及断点回归 (Regression Discontinuity) 等因果推理工具和因果识别策略。其中,DAG 几乎出现在书籍中的每一章节。
这本书不仅涵盖了很多案例,关注了工具变量法、断点回归法等准实验方法,还包括了经济学者目前关注的合成控制法。此外,书中提供了案例分析所需的数据、代码内容。因而,本科生、硕士生和刚入学的博士生如果想了解因果推理和学习诸如合成控制法这类的最新方法,可以参考这本书。
|
關於作者: |
斯科特·坎宁安(Scott Cunningham),美国得克萨斯州贝勒大学经济学教授,美国知名的计量经济学家,主要研究领域:犯罪经济学和劳动经济学,在《经济研究评论》(RES)等顶级期刊发表论文数十篇。
|
目錄:
|
以下是核心内容的基本架构,方便大家更好地了解这本书:
首先,作者介绍了有关因果推理、概率与回归相关概念和理论,为新接触因果推理的读者更好地学习打好基础。
第一章引言作者通过识别需求的价格弹性等一系列案例,介绍了因果推理的含义、如何区分相关性与因果关系等基本内容;第二章概率与回归回顾中,从基础的概率理论出发,回顾了随机过程、样本空间、统计独立性、事件和条件概率以及期望值、方差等统计定义。在此基础上,介绍了普通小二乘法、方差分析理论、稳健标准误等统计数据分析的基本方法。
其次,为更好地识别因果关系,第三章至第五章介绍了因果推理的工具。
第三章引入有向无环图 (DAG),这是一个有助于澄清变量之间的因果关系的强大的工具,讨论了后门标准和对撞机偏差两个概念。详细阅读这一章对后续阅读有很大的帮助;第四章讨论了潜在结果因果模型。因果效应可被定义为实际发生状态和反事实状态之间的比较,潜在结果表示法用反事实表示因果关系。书中定义了各种类型的因果效应:平均处理效应 (ATE)、干预组的平均处理效应 (ATT)、控制组的平均处理效应 (ATU)等。潜在结果因果模型成立依赖两个关键假设:一是强调被干预对象相互独立;二是在一定条件下,分配机制不会对潜在结果产生影响。潜在结果是由分配机制决定的,也十分强调匹配和倾向值分析对因果推理的重要性;第五章继续描述匹配和分配问题。贯穿这一章的概念是有条件独立假设 (CIA),通过学生分配问题表明处理分配是有条件的随机。当样本较少时,分配缺乏足够的数据,因而使得匹配和倾向值分析显得尤为重要。精确匹配和近似匹配均是因果推理的重要组成部分,倾向得分匹配作为一个工具,以使不同组别具有可比性。
后,在剩下的第六章至第十章,此书理论结合案例,分别介绍了识别因果推理的策略,包括断点回归、工具变量、面板数据、差分、合成控制五个方法。
断点回归 (Regression Discontinuity)的设计围绕核心变量、临界值、处理组分配和结果本身之间的关系。精确断点回归是其中一种方法,使用一个连续的分数,通过任意选择一个临界值来分配处理组和控制组,比较高于和低于临界值的人来估计一种特定的平均值。作者借助一个案例 “复制一个流行的设计:接近的选举” 进行具体说明;工具变量 (Instrumental Variables)设计可能是有史以来重要的研究设计之一。作者从显示一系列因果效应的 DAG 开始进行分析,认为其包含了理解工具变量策略所需的所有信息。工具变量法通常用于解决遗漏变量偏差、测量误差等问题,两阶段小二乘法是一个比较常用的方法,书中提供了一些数据,帮助读者更好地理解如何在实际数据中实现两阶段小二乘法。与断点回归不同,工具变量法的识别假设有 5 个。这使得使用工具变量法时通常出现弱工具变量等问题,因而研究者很难找到满足所有 5 个条件的工具变量;面板数据 (Panel Data)包含不同单位时间内重复测量的纵向数据。固定效应是一种估计因果效应有用的方法。只要处理和结果随时间变化,并且存在严格的外生性,那么固定效应将消除任何和所有未观测和观测的处理变量相关的不随时间变化的协变量。但是,这种方法不能处理随时间变化的、未观测到的异质性,而且当存在强反向因果路径时,面板方法是有偏的。作者通过回顾描述面板数据的 DAG 情况下,讨论一篇论文,然后在 R 和 Stata 中进行一个数据集的练习,很好的解释了上述问题;差分 (Difference-In-Differences)已经成为定量社会科学中受欢迎的研究设计之一。作者以简单的形式(同时处理一组单位)和更常见的形式(即在不同时间点处理一组单位)来解释差分方法。这一章的重点是确定估计处理效应所需的假设,包括通过事件研究提供平行趋势证据、安慰剂的重要性、有时间差异的双向固定效应等;合成控制 (Synthetic Control)目前是一个活跃的研究领域,人们期望通过合成控制方法进行大量的证伪联系。使用合成控制法进行比较案例研究,必须通过基于安慰剂的推断找到确切的 值,检查预处理的匹配,调查用于匹配的协变量的平衡性,并通过安慰剂估计检验模型的有效性。书中通过 “监狱建设和黑人男性监狱” 的案例,展示了如何在 Stata 中估计合成控制方法。但是,还有很多相关问题书中没有给出解决方法。
因果推理是一个重要且有趣的领域,越来越受到社会科学研究者的关注。
潜在结果因果模式提供了一种直观的方式来思考因果效应,该模型在理解使用异质的准实验研究设计来确定因果关系所需的假设方法非常有效;有向无环图对项目的设计阶段非常有用,在理论模型和对某些现象的理解以及识别所关心的因果效应的策略方面都受到关注;其它的识别因果效应的策略是目前微观经济学中常见的。
第一章 导论
什么是因果推断?
不要混淆相关性和因果性
最优化使一切变得内生
示例:确定需求的价格弹性
总结
第二章 概率与回归知识复习
第三章 有向无环图
有向无环图表示法的介绍
第四章 潜在结果因果模型
物理随机化
随机化推断
总结
第五章 匹配和子分类
子分类
精确匹配
近似匹配
第六章 断点回归
断点回归非常常见
使用RDD进行评估
对识别的挑战
复刻一个流行设计:势均力敌的选举
拐点回归设计
结论
第七章 工具变量
工具变量的历史:父与子
工具变量的直觉认识
同质性处理效应
父母滥食冰毒和儿童寄养
弱工具变量问题
异质性处理效应
应用
流行的IV设计
结论
第八章 面板数据
DAG的例子
估计
数据练习:对成人服务提供者的调查
总结
第九章 双重差分
约翰·斯诺=的霍乱假说
估计
推断
通过事件研究和前期的平行提供平行趋势的证据
安慰剂对DD方法的重要性
具有时间差异的双向固定效应
结论
第十章 合成控制法
比较案例研究的介绍
监狱建设和黑人男性监禁
本书总结
|
內容試閱:
|
推荐序 李井奎
2021年10月11日,诺贝尔经济学奖揭晓,来自美国伯克利加州大学的经济学教授戴维·卡德(David Card),与分别来自麻省理工学院和斯坦福大学的经济学教授约书亚·D.安格利斯特(Joshua D.Angrist)和奎多·W.因本斯(Guido W.Imbens)分享了这一奖项。在颁奖词中,诺奖委员会对卡德教授主要表彰“他对劳动经济学的经验性贡献”,而对于安格利里斯特教授和因本斯教授,则是“表彰他们对因果关系分析的方法学贡献”。
这届诺贝尔经济学奖得主的工作与以往我们印象中得过诺贝尔经济学奖的经济学大师们的工作有一个很大的不同。早年的诺贝尔经济学奖得主,如保罗·萨缪尔森、米尔顿·弗里德曼、弗里德里希·冯·哈耶克、杰拉德·德布鲁等等,都以理论见长,他们每一个人几乎都曾在某一个理论领域卓有建树,或者提出了新的经济理论,或者构建了令人生畏的经济数学模型,但这一届诺贝尔经济学奖得主的工作则主要是基于数据而做出的经验性贡献,即便是像因本斯教授这样以因果推断的理论方法为主攻方向的学者,也与经济学的经验研究保持着密切接触,就更不用说像卡德教授和安格里斯特教授这样在劳动经济学、教育经济学等经验研究领域做出诸多重要贡献的学者了。正如我国知名的青年政治学者刘瑜所说:“大多哲学和社科经典都写作于‘实证’几乎不可能的时代,比如,在二战之前,基本上不存在大规模的民意调查、完整的宏观经济和社会数据、科学上严谨的统计技术等等,所以大多数经典的写作方式只能是从概念到概念,从推断到推断,从灵感到灵感。这种写作方式往往能创造出很多很漂亮很有启发性的理论框架,但是很难校验这些理论的有效性,又因为不能校验它的有效性,即没有‘证伪’它的可能性,知识很难有效积累。”[1]现代经济学研究的这种经验转向,就与近三十年来数据可得性的改善和计量经济学的发展,有着密切的关联。
在我看来,这届诺贝尔经济学奖几乎是在肯定近三十年以来因果推断方法在现代经济学经验研究中的成功应用与发展。之所以这样说,是因为这三位教授虽然所做的研究主题各有不同,但他们的研究有很多的交叉。卡德教授虽然主要研究劳动经济学领域的问题,但他所使用的方法主要是因果关系推断;而安格里斯特教授和因本斯教授的获奖理由虽然是因果推断的方法学,但也都在劳动经济学领域多有发见。
探究因果关系是科学工作的重要目的。这三十年来,现代经济学借助统计学中对因果关系的认识,爆发了一场因果推断研究革命。就像哈佛大学的校聘教授加里·金所说:“在过去几十年里,人们对因果推断的了解比以往历史中的总和还要多。”由于我们大多数时候只能确定两个事件之间的相关关系,统计学家也严守“相关不是因果”的戒律,所以,对于因果关系的研究,很长时间以来一直困扰着经济学家。但是,自从上个世纪70年代以来,统计学家发明了一套“反事实框架”的方法,经济学家又在此基础上进一步发展了断点回归、工具变量等方法,使得对各种经济政策的因果性研究大行其道,推动了现代经济学向经验性实证研究的转向。同时,在计算机科学领域,以朱迪亚·铂尔为首的一批学者,也从因果图的角度对因果关系的研究做出了卓越的贡献。
摆在读者诸君面前的这本《因果推断》,就是对过去几十年来发展的因果推断计量经济学方法的一次教学上的总结。本书作者斯科特·坎宁安原本是一个文艺青年,年轻的时候在田纳西大学修读英文,一心想当一名诗人。这要是放在我国,他就彷佛是一个地方性大学的中文系学生,梦想着将来成为一名诗人。但残酷的现实很快让斯科特打消了这个念头,毕业后他结了婚,而且很快了有孩子,为了谋生,他不得不接受一份市场调研员的工作来养家糊口。终,他接受了著名诗人里尔克的劝谏。里尔克说,如果你不写诗也能活下去,那就不应该再写诗了。斯科特感到,自己不写诗也能活下去,所以就决定不再写诗。但这份市场调研员的工作却让他逐渐对数据分析感起了兴趣。多年以后,在斯科特沉醉于由因果推断而深入进去的经济学研究时,他在重新温习了里尔克的那句箴言之后,扪心自问:“如果没有经济学,我是否还能活下去?”这一次,他得到的答案是:不能!
作为一名曾经的诗人,要转向经济学研究,尤其是应用计量经济学方面的研究,对于斯科特来说,其过程当然是非常艰难的。这种艰难主要体现在两个方面,一个是学习过程的艰辛,一个是研究过程的艰辛。说实话,当初在读到斯科特的这本书时,对于他的这种转型之艰难,我是心有戚戚焉的。我当年也是一名文艺青年,甚至到了读硕士阶段,也经常写诗自娱自乐,所谓“沉饮聊自遣,放歌破愁绝”。但当时的风气,如果一个人数学不够好,那就不用考虑做经济学研究了。读书期间,教我们高级微观经济学的经济学老师,他就明白表示我们这些数学不够好的土博士是做不了严肃的经济研究的,他的研究做得很好,后来也在《美国经济评论》等国际优秀经济学刊物发表过文章。我读书期间的这些遭遇,后来激励了我一直坚持深入学习数学,也激励了我对应用计量经济学的学习和研究,但这个过程是很不容易的。我想,斯科特当年肯定也遇到过与我一样的苦闷和挫败。但好在,兴趣是好的老师。斯科特终申请到了佐治亚大学的经济学博士项目,开始学习经济学。
当他决定把计量经济学作为他的主要研究领域时,虽然他知道计量经济学很难学,但架不住他对诸如教育回报、犯罪、种族歧视、不平等等社会经济问题的强烈兴趣,还是毅然决然地投身到了这一领域。为此,他几乎修读了佐治亚大学所有的计量经济学课程,而且其中的一些课程他还修了不止一次。他从基础的概率统计课程学起,逐渐掌握了处理各种数据类型的计量经济学方法。但那个时候的佐治亚大学经济系,与当时大多数大学的经济系一样,并没有开设因果推断方面的课程。原因很简单,因果推断的方法此时还处于萌芽状态,还很不系统。就在斯科特通过了博士资格考试,开始进入到博士论文的写作阶段时,他接触到了因果推断的方法,这把他带入了研究的新天地,也使他从此沉迷于这一方法的学习和应用之中。
斯科特博士毕业后到美国德克萨斯州的贝勒大学教书,现在他已经是那所大学的经济学教授了。刚开始教书那会儿,学校安排他讲授计量经济学,他发现,当时计量经济学的课程体系中仍然没有因果关系理论的位置,于是,他在失望之余,申请开设了一门关于因果关系的新课程——因果推断与研究设计。这本书就是他为这门课程积十余年之功所写的教科书。在这个过程中,他还给美国南部多个大学的经济系进行因果推断方面的师资培训,在美国的公共媒体平台上不遗余力地推广和普及因果推断研究方法。这都使他成为因果推断教学和研究领域的一名活跃的学者。
如今,市面上关于因果推断的教材和专著越来越多起来,但本书仍然能够占据一席之地。综合来看,这本《因果推断》的教材有以下几个优点。
第一个优点是它对因果推断领域的理论与方法涵盖得非常广泛,这一点试着与当前流行的几本因果推断领域的教材进行比较就可以知道。目前为流行的因果推断方面的教材主要有以下三本:一本是为经典的《基本无害的计量经济学》[2],这是2009年由著名经济学安格利斯特和皮施克合作写的一本开创性的应用微观计量教材,但这本书对于合成控制法和因果图模型并没有多着笔墨,而这些内容现在来看是非常有用的,值得放入教科书之中。此外还有两本因果推断教材,其中摩根和温希普(Morgan and Winship,2014)[3]的书对于经济学家常用的断点回归和面板数据部分涉及得很不够;而因本斯和鲁宾(Imbens and Rubin,2015)[4]这本经典著作虽然详细介绍了潜在结果框架、实验设计、匹配和工具变量方法,却没有包含因果图、断点回归、面板数据活合成控制等内容。因此,从涵盖的范围来看,对于经济学家来说,本书关于因果推断的理论和方法的介绍是非常全面的。
本书的第二大有点就是它的实用性,它不仅介绍了因果推断的理论和方法,更重要的是,它还融汇了编程示例、数据和详细的解释,分别使用R和Stata软件把具体的编程都手把手地教给读者,因此这本书真正称得上想研究人员之所想。甚而至于,一个对因果推断和编程一无所知之人,也可以从本书开始,逐步达到胜任因果推断的境地。
本书的第三个优点是它包含了大量实例,这些实例有些是因果推断领域的经典论文,有些则是作者自己的研究所得。这些实例具体而微地为读者展示了一项优秀的研究是如何开展的,如何获取数据,编写代码,如何利用理论和场景知识,在自己的项目中实现合理的设计。
当然,本书也有些白璧微瑕之处,主要集中在关于概率论和统计学基础知识的介绍部分,其中的一些公式和推导过程出现了一些小的错误。在翻译的过程中,译者已经根据具体的情况对这些地方一一作了修正,不会影响到读者们的阅读。
因果推断方法既是困难的,也是有趣的。希望这本书能够有助于大家学习因果推断这一计量经济学方法,做有趣而严谨的经济学经验研究!
2023年3月15日写于浙江工商大学·钱塘之滨
斯科特?坎宁安(Scott Cunningham) 的因果推断有以下优点:1.涵盖范围和技术更新程度超越目前流行的因果推断著作。本书包含了最为前沿的各类因果识别方法,且包括了这些方法的最新进展,包含了合成控制法和因果图模型。1.作者从基础的概率与回归分析讲起,引出因果革命中最基础的两个分析工具?D?D无向因果图和潜在分析框架。接下来分别介绍了目前主流的因果识别方法,分别是:匹配与分层方法,断点回归,工具变量,面板数据与双重差分法,合成控制法。以双重差分法(DID)为例,最近两年出现了一大批基于异质性处理效应的DID 估计,这些方法也被经济学顶级期刊(AER,QJE等)上的文章所采用,对双重差分法的最新进展给出了介绍,而市场上其他书籍没有。2.2.融汇了编程实例、数据和详细的解释,分别使用Stata和R程序中的演示实证练习,手把手教给读者,真正想读者之所想。使用两套程序完成相同的任务,一方面照顾了经济学以及社会学、政治学等其他不同专业的读者的需求偏好,另一方面对已经了解了R并且想要学习Stata,或者已经了解了Stata想要学习R的读者会很有帮助。本书作者在网站提供了可下载的数据集和程序。3.实用性强,能让初学者快速入门和上手开始研究。这些实例有些是因果推断领域的经典论文,有些则是作者自己的研究所得。这些实例具体而微地像读者展示了一项研究成果是如何开展的,如何获取数据、编写代码,如何利用理论和场景知识,在自己的项目中实现合理的设计。一个对因果推断和编程一无所知的人,也可以从这本书开始,逐步达到胜任因果推断的境地。4 .该书图文并茂,语言风趣简练,引入入胜。中文版纠正了英文原书中的许多编校错误。
以下是核心内容的基本架构,方便大家更好地了解这本书:
首先,作者介绍了有关因果推理、概率与回归相关概念和理论,为新接触因果推理的读者更好地学习打好基础。
?第一章引言作者通过识别需求的价格弹性等一系列案例,介绍了因果推理的含义、如何区分相关性与因果关系等基本内容;
?第二章概率与回归回顾中,从基础的概率理论出发,回顾了随机过程、样本空间、统计独立性、事件和条件概率以及期望值、方差等统计定义。在此基础上,介绍了普通最小二乘法、方差分析理论、稳健标准误等统计数据分析的基本方法。
其次,为更好地识别因果关系,第三章至第五章介绍了因果推理的工具。
?第三章引入有向无环图 (DAG),这是一个有助于澄清变量之间的因果关系的强大的工具,讨论了后门标准和对撞机偏差两个概念。详细阅读这一章对后续阅读有很大的帮助;
?第四章讨论了潜在结果因果模型。因果效应可被定义为实际发生状态和反事实状态之间的比较,潜在结果表示法用反事实表示因果关系。书中定义了各种类型的因果效应:平均处理效应 (ATE)、干预组的平均处理效应 (ATT)、控制组的平均处理效应 (ATU)等。潜在结果因果模型成立依赖两个关键假设:一是强调被干预对象相互独立;二是在一定条件下,分配机制不会对潜在结果产生影响。潜在结果是由分配机制决定的,也十分强调匹配和倾向值分析对因果推理的重要性;
?第五章继续描述匹配和分配问题。贯穿这一章的概念是有条件独立假设 (CIA),通过学生分配问题表明处理分配是有条件的随机。当样本较少时,分配缺乏足够的数据,因而使得匹配和倾向值分析显得尤为重要。精确匹配和近似匹配均是因果推理的重要组成部分,倾向得分匹配作为一个工具,以使不同组别具有可比性。
最后,在剩下的第六章至第十章,此书理论结合案例,分别介绍了识别因果推理的策略,包括断点回归、工具变量、面板数据、差分、合成控制五个方法。
?断点回归 (Regression Discontinuity)?的设计围绕核心变量、临界值、处理组分配和结果本身之间的关系。精确断点回归是其中一种方法,使用一个连续的分数,通过任意选择一个临界值来分配处理组和控制组,比较高于和低于临界值的人来估计一种特定的平均值。作者借助一个案例 “复制一个流行的设计:接近的选举” 进行具体说明;
?工具变量 (Instrumental Variables)?设计可能是有史以来最重要的研究设计之一。作者从显示一系列因果效应的 DAG 开始进行分析,认为其包含了理解工具变量策略所需的所有信息。工具变量法通常用于解决遗漏变量偏差、测量误差等问题,两阶段最小二乘法是一个比较常用的方法,书中提供了一些数据,帮助读者更好地理解如何在实际数据中实现两阶段最小二乘法。与断点回归不同,工具变量法的识别假设有 5 个。这使得使用工具变量法时通常出现弱工具变量等问题,因而研究者很难找
|
|