注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

凤凰周刊

不党、不派、不私、不卖、不盲

 
 
 

日志

 
 

胖子的朋友也更可能变成胖子?一场关于研究方法的争论(来源:@政见CNPolitics )  

2014-04-14 21:39:00|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
可谓难于登天。 可是,能够得到学界认可的研究,一定也在这一方面做出了努力;那么,C&F 是否找到了区分三种机制的方案? 肥胖传染的方向性 C&F 的一系列研究设计与逻辑推导过程都很类似,且依赖于同一个数据库——一项关于心脏健康的大型调查数据。该调查始于 1948 年,约每 2-4 年采集一次数据,包括体检数据与情绪数据(是否感到幸福、孤独、抑郁等);前后跟踪调查了三代人,总计 12000 余人。在如此漫长的调查过程中,为了保证能够持续联系到受访者,访问员记录下了每位受访者的亲人、朋友和同事信息,其中包括一名 “最亲密且并非亲人的朋友”;妙的是,列出的名单中相当一部分人也参与了这项调查。正是这一在原本研究目的之外的独特数据给了 C&F 以灵感,他们整理出了这批手写的笔记,并以此为依据绘出了受访者之间的关系图。 C&F 将其中第二代约 5000 人视为分析中心,列出他们与其他人的关系,通过朋友的各项指标来预测他们的指标。如此一来,对多年来采集的数据经过简单的统计分析就可以发现,这些中心小组成员的健康与情绪状况与其朋友十分类似;朋友的肥胖、抽烟、酗酒、抑郁的问题,也更有可能传染到他们身上。 问题在于,如何知道这背后的机理究竟是感染、类聚还是环境效应? 为排除类聚效应,在数据分析中,C&F 不仅列入了 “朋友” 们同一次调查的身体情况,也列入了上一次调查的数据;也就是说,一切影响都是在控制了上一次调查数据的情况下得出的,可以视为 “最近两年的净影响”。 为排除环境效应,C&F 对友谊标注了方向:如果中心小组成员杰克称露丝为其最好的朋友,而露丝并未说出杰克的名字,那么这段关系就是单向的;如果双方皆称对方为自己最好的朋友,那么这段关系是双向的。结果发现,单向友谊会导致不对称的结果!例如,若杰克单方面称露丝为好朋友,那么一旦露丝成了胖子,杰克也变成胖子的几率就会上升 57%;而反过来,若露丝单方面称杰克为好朋友,那么露丝变成胖子后,杰克变成胖子的几率只会上升 13%,且这个数字在统计意义上不显著,即可以认为不存在。C&F 认为,这种不对称影响证明了:环境并非始作俑者,至少不是唯一的影响因素——因为环境对二人的影响应该是相同的。 此外,为计算 “三度影响”,C&F 采用进行了随机模拟,即在网络结构不变的情况下,将个体的肥胖情况进行了随机重分布,并作为对照组与现实数据进行比较,最终得出肥胖与且仅与三重人际关系相关的结论。 应该说,这个设计是很巧妙的,也与数据库本身得天独厚的条件有关。那么,批评者又立足何处呢? 无法排除的阴影机制 其实,自从第一篇论文发表以来, C&F 就面临着来自各个学科的质疑。 批评者中,最忿忿不平的一位或许是印第安那大学伯明顿分校数学系教授 Russell Lyons。他的批评文章名为《证据不足的医学研究如何通过错误的社会网络分析传播》(The Spread of Evidence-poor Medicine via Flawed Social-network Analysis),发表于《统计、政治与政策》学刊(Statistics, Politics, and Policy)上。他在文中花了大半篇幅述说这篇论文发表的艰辛:曾发表 C&F 论文的刊物无一例外不肯接受批评文章,而不曾发表 C&F 论文的刊物又不愿意发表针对其他刊物文章的批评;当他无奈之下将文章投去一家统计学专业刊物时,编辑又觉得“话倒是在理,可是这个问题不是很重要”! 或许正因如此,最后发表的版本也显得格外愤世嫉俗:Lyons 认为,C&F 的走红说明现在的研究风气存在严重的问题,许多研究者对于统计学盲目依赖、不求甚解,得出的结果自然也站不住脚。 例如,C&F 在分析中纳入前一次调查的数据,认为这样就可以控制类聚程度,仅体现出 “净影响”。但仔细观察会发现,朋友在上一次和这一次调查中肥胖与否,对个体自身肥胖与否的影响是相反的——也就是说,如果杰克的朋友露丝在两年前是个胖子,那么杰克现在变成

2007 年起,时任哈佛大学社会学系及医学院教授的 Nicholas A. Christakis(中文名古乐朋,现为耶鲁大学社会学系教授)与加州大学圣地亚哥分校政治学系及医学遗传学系教授 James H. Fowler接连发表一系列研究,在多个领域内同时公布一项重要发现:胖子的可能性反而会降低!如果将露丝两年前与现在的肥胖状况综合考虑,那么他对杰克的影响几乎为零。 第二,C&F 试图用单向友谊的不对称影响来排除环境效应,但事实上,这个 “不对称” 在统计学上根本不显著。57% 这个数字只是统计估值,严谨来看,C&F 应该有 95% 的信心说这个数字位于区间 6%~123% 之间;而反向影响在统计学上不显著,也就是说无法与 0 区分开来。C&F 的逻辑是,0 小于 6%,因此两个方向的影响之间存在本质区别。但事实上,“无法与 0 区分” 和 “等于 0” 完全是两码事,如果用置信区间表示,C&F 应该有 95% 的信心说这个数字其实位于 -28%~68% 之间——两个区间有大面积互相重叠。因此,C&F 并没有证明单向友谊的影响是不对称的,也就谈不上排除环境效应了。 而如果退一步承认两个数字有显著区别,更糟糕的悖论便出现了:杰克是中心小组成员,所以他是被预测对象,而露丝被视为 “影响者”;但其实这完全是人为划分的。如果反过来思考杰克对露丝的影响,那岂不是恰好相反?也就是说,当杰克单方面视露丝为好友时,他对露丝造成的影响反而更高(57%)? Lyons 进一步分析指出,即使不考虑统计学错误,C&F 的结论也无法区分感染、类聚和环境三种机制。只要一个简单的交友法则就可以让 C&F 的努力化为乌有:任何一个人都指认所有人中跟自己最为相近的人做好朋友。如果这里的“相近”指的是性格,那么造成的就是类聚效应;如果指的是地理位置,那么就是环境效应。显然,这种距离可以是不对称的:杰克认为露丝离自己最近,但露丝身旁可能有距离更近的卡尔;因此,类聚与环境造成的影响当然也可以不均匀。 Lyons 指出,在有关肥胖、吸烟、幸福感和孤独感的至少四篇论文中,C&F 都犯下了一模一样的错误。一旦抽走这一块基石,他们的整个学术大厦都将摇摇欲坠。更令他不爽的是,C&F 用来迅速制造论文的宝贵数据库从未向其他研究者公开,导致无人能够做重复性和检验性研究,这就使他们迅速崛起的名声显得更为可疑。 应该说,Lyons 的批评是十分到位的。其后 C&F 虽针对各路批评做出过反驳,但对于最致命的置信区间的重叠问题并未给出有说服力的解答,只是诉诸直觉:“多次实验均出现相同的趋势,恐怕无法用概率和巧合来解释”。不过,Lyons 太激烈的措辞也让许多人觉得过火了,毕竟 C&F 首次提出通过关系的方向性和影响的不对称性来区分类聚效应和感染效应,这种新思路本身就是一种方法论上的贡献。 ◎ 刘冉 政见观察员 参考文献: Christakis, N. A., & Fowler, J. H. (2007). The spread of obesity in a large social network over 32 years. New England journal of medicine, 357(4), 370-379. Lyons, R. (2011). The spread of evidence-poor medicine via flawed social-network analysis. Statistics, Politics, and Policy, 2(1).
 个人的许多特征和行为可能通过社会网络 “传染” 身边的朋友,其中包括肥胖、吸烟、酗酒、失眠、嗑药、投票乃至离婚等等;这种影响平均能够跨越社会网络中的 “三度”,亦即传播到 “朋友的朋友的朋友”。
这一发现被简要地称为 “三度影响法则”。两位教授(下文简称 C&F)认为,这种传播可能有两种机制,其一是影响朋友的观念,例如令其更容易接受肥胖的外表;其二是直接影响其行为,例如令其更爱大吃大喝而懒于运动。 
或许由于结论简明易懂又耸人听闻,C&F 的研究迅速进入公众视野,甚至成为社会热点话题,登上了《纽约时报》的头版;两位研究者被《外交政策》杂志列入 2010 年度的 “全球百大思想家”,其中口才了得的 Fowler 更是受 Colbert Report 等脱口秀栏目邀请,在各种电视与网络节目中推广自己的研究 。他们合著的畅销科普读物《大连接》(Connected: The Surprising Power of Our Social Networks and How They Shape Our Lives)奠定了许多读者对于网络研究的初步认知,也进一步将 “三度影响” 打造成如同 “六度分隔” 一般流行的谈资。

2007 年起,时任哈佛大学社会学系及医学院教授的 Nicholas A. Christakis(中文名古乐朋,现为耶鲁大学社会学系教授)与加州大学圣地亚哥分校政治学系及医学遗传学系教授 James H. Fowler接连发表一系列研究,在多个领域内同时公布一项重要发现: 个人的许多特征和行为可能通过社会网络 “传染” 身边的朋友,其中包括肥胖、吸烟、酗酒、失眠、嗑药、投票乃至离婚等等;这种影响平均能够跨越社会网络中的 “三度”,亦即传播到 “朋友的朋友的朋友”。 这一发现被简要地称为 “三度影响法则”。两位教授(下文简称 C&F)认为,这种传播可能有两种机制,其一是影响朋友的观念,例如令其更容易接受肥胖的外表;其二是直接影响其行为,例如令其更爱大吃大喝而懒于运动。 或许由于结论简明易懂又耸人听闻,C&F 的研究迅速进入公众视野,甚至成为社会热点话题,登上了《纽约时报》的头版;两位研究者被《外交政策》杂志列入 2010 年度的 “全球百大思想家”,其中口才了得的 Fowler 更是受 Colbert Report 等脱口秀栏目邀请,在各种电视与网络节目中推广自己的研究 。他们合著的畅销科普读物《大连接》(Connected: The Surprising Power of Our Social Networks and How They Shape Our Lives)奠定了许多读者对于网络研究的初步认知,也进一步将 “三度影响” 打造成如同 “六度分隔” 一般流行的谈资。 可是,这个发现究竟是如何做出的,又是否得到了学界认可?事实上,尽管社会科学界和医学界普遍对 C&F 的发现表示赞叹与重视,但质疑的声音也从未平息,且可称得上刀刀见血。这一切都是因为 C& F 的研究涉及到社会科学界苦恼已久的大问题:区分 “物以类聚” 与 “近墨者黑” 两种机制。 完全相反的解释机制 C&F 的研究,或许会令我们想起 “近朱者赤,近墨者黑” 这句话——两个人相处久了,难免会互相影响,变得愈来愈相似。在社会学中,这种作用被称为 “影响”(influence)、“诱导”(induction)或 “感染”(contagion)。用肥胖做例子,就是胖子的朋友也更可能变成胖子——正是 C&F 的研究结论。 可是我们还听过 “物以类聚,人以群分” 这句俗语,英文中也有类似的说法:“A bird of feather flock together”——同种羽毛的鸟儿会聚在一起。具体到社会现象,就是不同性别、年龄、职业、教育背景、爱好兴趣的人,往往更乐于跟与自己相似的人来往;在社会学中,这被称为 “选择效应”(selection)或 “类聚效应”(Homophily)。也就是说,或许不是胖子让自己的朋友变胖,而是胖子本来就更容易跟胖子成为朋友(显类聚);哪怕胖子的朋友一开始不是胖子,也有可能是因为两人都喜欢吃甜食才特别投脾气(潜类聚)。 两种机制的运作逻辑完全相反:前者由相识而相似,后者由相似而相识。然而它们导致的现象却完全相同,即交往密切的人群往往彼此相像。 且慢,是不是还有第三种可能?设想一下,两个人成为朋友,或许因为他们是同一所学校的学生;而他们都变成胖子,或许是因为学校门口就有一间麦当劳。也就是说,可能根本原因并不在个体身上,而是存在第三种机制——环境因素,同时导致两人的 “相识” 与 “相似”。 再举一个简单的例子:当你观察到杰克与露丝两个小伙伴先后从泰坦尼克号上跳进了海里,你怎么解释这一现象?C&F 的答案或许是露丝受到了杰克的感召,所以模仿了他的行动(感染效应);但事实也许是他们两个原本就都热爱浪漫与冒险,因此才成为小伙伴,所以做出相似的举动毫不出奇(类聚效应);更可能是因为泰坦尼克号就要沉了(环境效应)。 社会科学并非简单观察社会现实或发发问卷就可以交差,要想探索现象背后的真正机理,科学严谨的研究设计必不可少。问题在于,在真实社会中,社会网络、个体特性与环境因素往往紧密相连难分难解,要想剥离开来分别测试其影响力

可是,这个发现究竟是如何做出的,又是否得到了学界认可?事实上,尽管社会科学界和医学界普遍对 C&F 的发现表示赞叹与重视,但质疑的声音也从未平息,且可称得上刀刀见血。这一切都是因为 C& F 的研究涉及到社会科学界苦恼已久的大问题:区分 “物以类聚” 与 “近墨者黑” 两种机制。

完全相反的解释机制 

C&F 的研究,或许会令我们想起 “近朱者赤,近墨者黑” 这句话——两个人相处久了,难免会互相影响,变得愈来愈相似。在社会学中,这种作用被称为 “影响”(influence)、“诱导”(induction)或 “感染”(contagion)。用肥胖做例子,就是胖子的朋友也更可能变成胖子——正是 C&F 的研究结论。
可是我们还听过 “物以类聚,人以群分” 这句俗语,英文中也有类似的说法:“A bird of feather flock together”——同种羽毛的鸟儿会聚在一起。具体到社会现象,就是不同性别、年龄、职业、教育背景、爱好兴趣的人,往往更乐于跟与自己相似的人来往;在社会学中,这被称为  “选择效应”(selection)或 “类聚效应”(Homophily)。也就是说,或许不是胖子让自己的朋友变胖,而是胖子本来就更容易跟胖子成为朋友(显类聚);哪怕胖子的朋友一开始不是胖子,也有可能是因为两人都喜欢吃甜食才特别投脾气(潜类聚)。

两种机制的运作逻辑完全相反:前者由相识而相似,后者由相似而相识。然而它们导致的现象却完全相同,即交往密切的人群往往彼此相像。

胖子的可能性反而会降低!如果将露丝两年前与现在的肥胖状况综合考虑,那么他对杰克的影响几乎为零。 第二,C&F 试图用单向友谊的不对称影响来排除环境效应,但事实上,这个 “不对称” 在统计学上根本不显著。57% 这个数字只是统计估值,严谨来看,C&F 应该有 95% 的信心说这个数字位于区间 6%~123% 之间;而反向影响在统计学上不显著,也就是说无法与 0 区分开来。C&F 的逻辑是,0 小于 6%,因此两个方向的影响之间存在本质区别。但事实上,“无法与 0 区分” 和 “等于 0” 完全是两码事,如果用置信区间表示,C&F 应该有 95% 的信心说这个数字其实位于 -28%~68% 之间——两个区间有大面积互相重叠。因此,C&F 并没有证明单向友谊的影响是不对称的,也就谈不上排除环境效应了。 而如果退一步承认两个数字有显著区别,更糟糕的悖论便出现了:杰克是中心小组成员,所以他是被预测对象,而露丝被视为 “影响者”;但其实这完全是人为划分的。如果反过来思考杰克对露丝的影响,那岂不是恰好相反?也就是说,当杰克单方面视露丝为好友时,他对露丝造成的影响反而更高(57%)? Lyons 进一步分析指出,即使不考虑统计学错误,C&F 的结论也无法区分感染、类聚和环境三种机制。只要一个简单的交友法则就可以让 C&F 的努力化为乌有:任何一个人都指认所有人中跟自己最为相近的人做好朋友。如果这里的“相近”指的是性格,那么造成的就是类聚效应;如果指的是地理位置,那么就是环境效应。显然,这种距离可以是不对称的:杰克认为露丝离自己最近,但露丝身旁可能有距离更近的卡尔;因此,类聚与环境造成的影响当然也可以不均匀。 Lyons 指出,在有关肥胖、吸烟、幸福感和孤独感的至少四篇论文中,C&F 都犯下了一模一样的错误。一旦抽走这一块基石,他们的整个学术大厦都将摇摇欲坠。更令他不爽的是,C&F 用来迅速制造论文的宝贵数据库从未向其他研究者公开,导致无人能够做重复性和检验性研究,这就使他们迅速崛起的名声显得更为可疑。 应该说,Lyons 的批评是十分到位的。其后 C&F 虽针对各路批评做出过反驳,但对于最致命的置信区间的重叠问题并未给出有说服力的解答,只是诉诸直觉:“多次实验均出现相同的趋势,恐怕无法用概率和巧合来解释”。不过,Lyons 太激烈的措辞也让许多人觉得过火了,毕竟 C&F 首次提出通过关系的方向性和影响的不对称性来区分类聚效应和感染效应,这种新思路本身就是一种方法论上的贡献。 ◎ 刘冉 政见观察员 参考文献: Christakis, N. A., & Fowler, J. H. (2007). The spread of obesity in a large social network over 32 years. New England journal of medicine, 357(4), 370-379. Lyons, R. (2011). The spread of evidence-poor medicine via flawed social-network analysis. Statistics, Politics, and Policy, 2(1).

且慢,是不是还有第三种可能?设想一下,两个人成为朋友,或许因为他们是同一所学校的学生;而他们都变成胖子,或许是因为学校门口就有一间麦当劳。也就是说,可能根本原因并不在个体身上,而是存在第三种机制——环境因素,同时导致两人的 “相识” 与 “相似”。

再举一个简单的例子:当你观察到杰克与露丝两个小伙伴先后从泰坦尼克号上跳进了海里,你怎么解释这一现象?C&F 的答案或许是露丝受到了杰克的感召,所以模仿了他的行动(感染效应);但事实也许是他们两个原本就都热爱浪漫与冒险,因此才成为小伙伴,所以做出相似的举动毫不出奇(类聚效应);更可能是因为泰坦尼克号就要沉了(环境效应)。

社会科学并非简单观察社会现实或发发问卷就可以交差,要想探索现象背后的真正机理,科学严谨的研究设计必不可少。问题在于,在真实社会中,社会网络、个体特性与环境因素往往紧密相连难分难解,要想剥离开来分别测试其影响力可谓难于登天。 可是,能够得到学界认可的研究,一定也在这一方面做出了努力;那么,C&F 是否找到了区分三种机制的方案?

肥胖传染的方向性可谓难于登天。 可是,能够得到学界认可的研究,一定也在这一方面做出了努力;那么,C&F 是否找到了区分三种机制的方案? 肥胖传染的方向性 C&F 的一系列研究设计与逻辑推导过程都很类似,且依赖于同一个数据库——一项关于心脏健康的大型调查数据。该调查始于 1948 年,约每 2-4 年采集一次数据,包括体检数据与情绪数据(是否感到幸福、孤独、抑郁等);前后跟踪调查了三代人,总计 12000 余人。在如此漫长的调查过程中,为了保证能够持续联系到受访者,访问员记录下了每位受访者的亲人、朋友和同事信息,其中包括一名 “最亲密且并非亲人的朋友”;妙的是,列出的名单中相当一部分人也参与了这项调查。正是这一在原本研究目的之外的独特数据给了 C&F 以灵感,他们整理出了这批手写的笔记,并以此为依据绘出了受访者之间的关系图。 C&F 将其中第二代约 5000 人视为分析中心,列出他们与其他人的关系,通过朋友的各项指标来预测他们的指标。如此一来,对多年来采集的数据经过简单的统计分析就可以发现,这些中心小组成员的健康与情绪状况与其朋友十分类似;朋友的肥胖、抽烟、酗酒、抑郁的问题,也更有可能传染到他们身上。 问题在于,如何知道这背后的机理究竟是感染、类聚还是环境效应? 为排除类聚效应,在数据分析中,C&F 不仅列入了 “朋友” 们同一次调查的身体情况,也列入了上一次调查的数据;也就是说,一切影响都是在控制了上一次调查数据的情况下得出的,可以视为 “最近两年的净影响”。 为排除环境效应,C&F 对友谊标注了方向:如果中心小组成员杰克称露丝为其最好的朋友,而露丝并未说出杰克的名字,那么这段关系就是单向的;如果双方皆称对方为自己最好的朋友,那么这段关系是双向的。结果发现,单向友谊会导致不对称的结果!例如,若杰克单方面称露丝为好朋友,那么一旦露丝成了胖子,杰克也变成胖子的几率就会上升 57%;而反过来,若露丝单方面称杰克为好朋友,那么露丝变成胖子后,杰克变成胖子的几率只会上升 13%,且这个数字在统计意义上不显著,即可以认为不存在。C&F 认为,这种不对称影响证明了:环境并非始作俑者,至少不是唯一的影响因素——因为环境对二人的影响应该是相同的。 此外,为计算 “三度影响”,C&F 采用进行了随机模拟,即在网络结构不变的情况下,将个体的肥胖情况进行了随机重分布,并作为对照组与现实数据进行比较,最终得出肥胖与且仅与三重人际关系相关的结论。 应该说,这个设计是很巧妙的,也与数据库本身得天独厚的条件有关。那么,批评者又立足何处呢? 无法排除的阴影机制 其实,自从第一篇论文发表以来, C&F 就面临着来自各个学科的质疑。 批评者中,最忿忿不平的一位或许是印第安那大学伯明顿分校数学系教授 Russell Lyons。他的批评文章名为《证据不足的医学研究如何通过错误的社会网络分析传播》(The Spread of Evidence-poor Medicine via Flawed Social-network Analysis),发表于《统计、政治与政策》学刊(Statistics, Politics, and Policy)上。他在文中花了大半篇幅述说这篇论文发表的艰辛:曾发表 C&F 论文的刊物无一例外不肯接受批评文章,而不曾发表 C&F 论文的刊物又不愿意发表针对其他刊物文章的批评;当他无奈之下将文章投去一家统计学专业刊物时,编辑又觉得“话倒是在理,可是这个问题不是很重要”! 或许正因如此,最后发表的版本也显得格外愤世嫉俗:Lyons 认为,C&F 的走红说明现在的研究风气存在严重的问题,许多研究者对于统计学盲目依赖、不求甚解,得出的结果自然也站不住脚。 例如,C&F 在分析中纳入前一次调查的数据,认为这样就可以控制类聚程度,仅体现出 “净影响”。但仔细观察会发现,朋友在上一次和这一次调查中肥胖与否,对个体自身肥胖与否的影响是相反的——也就是说,如果杰克的朋友露丝在两年前是个胖子,那么杰克现在变成
C&F 的一系列研究设计与逻辑推导过程都很类似,且依赖于同一个数据库——一项关于心脏健康的大型调查数据。该调查始于  1948 年,约每 2-4 年采集一次数据,包括体检数据与情绪数据(是否感到幸福、孤独、抑郁等);前后跟踪调查了三代人,总计 12000 余人。在如此漫长的调查过程中,为了保证能够持续联系到受访者,访问员记录下了每位受访者的亲人、朋友和同事信息,其中包括一名 “最亲密且并非亲人的朋友”;妙的是,列出的名单中相当一部分人也参与了这项调查。正是这一在原本研究目的之外的独特数据给了 C&F 以灵感,他们整理出了这批手写的笔记,并以此为依据绘出了受访者之间的关系图。

C&F 将其中第二代约 5000 人视为分析中心,列出他们与其他人的关系,通过朋友的各项指标来预测他们的指标。如此一来,对多年来采集的数据经过简单的统计分析就可以发现,这些中心小组成员的健康与情绪状况与其朋友十分类似;朋友的肥胖、抽烟、酗酒、抑郁的问题,也更有可能传染到他们身上。

问题在于,如何知道这背后的机理究竟是感染、类聚还是环境效应?

为排除类聚效应,在数据分析中,C&F 不仅列入了 “朋友” 们同一次调查的身体情况,也列入了上一次调查的数据;也就是说,一切影响都是在控制了上一次调查数据的情况下得出的,可以视为 “最近两年的净影响”。
为排除环境效应,C&F 对友谊标注了方向:如果中心小组成员杰克称露丝为其最好的朋友,而露丝并未说出杰克的名字,那么这段关系就是单向的;如果双方皆称对方为自己最好的朋友,那么这段关系是双向的。结果发现,单向友谊会导致不对称的结果!例如,若杰克单方面称露丝为好朋友,那么一旦露丝成了胖子,杰克也变成胖子的几率就会上升 57%;而反过来,若露丝单方面称杰克为好朋友,那么露丝变成胖子后,杰克变成胖子的几率只会上升 13%,且这个数字在统计意义上不显著,即可以认为不存在。C&F 认为,这种不对称影响证明了:环境并非始作俑者,至少不是唯一的影响因素——因为环境对二人的影响应该是相同的。

此外,为计算 “三度影响”,C&F 采用进行了随机模拟,即在网络结构不变的情况下,将个体的肥胖情况进行了随机重分布,并作为对照组与现实数据进行比较,最终得出肥胖与且仅与三重人际关系相关的结论。

应该说,这个设计是很巧妙的,也与数据库本身得天独厚的条件有关。那么,批评者又立足何处呢?
 
2007 年起,时任哈佛大学社会学系及医学院教授的 Nicholas A. Christakis(中文名古乐朋,现为耶鲁大学社会学系教授)与加州大学圣地亚哥分校政治学系及医学遗传学系教授 James H. Fowler接连发表一系列研究,在多个领域内同时公布一项重要发现: 个人的许多特征和行为可能通过社会网络 “传染” 身边的朋友,其中包括肥胖、吸烟、酗酒、失眠、嗑药、投票乃至离婚等等;这种影响平均能够跨越社会网络中的 “三度”,亦即传播到 “朋友的朋友的朋友”。 这一发现被简要地称为 “三度影响法则”。两位教授(下文简称 C&F)认为,这种传播可能有两种机制,其一是影响朋友的观念,例如令其更容易接受肥胖的外表;其二是直接影响其行为,例如令其更爱大吃大喝而懒于运动。 或许由于结论简明易懂又耸人听闻,C&F 的研究迅速进入公众视野,甚至成为社会热点话题,登上了《纽约时报》的头版;两位研究者被《外交政策》杂志列入 2010 年度的 “全球百大思想家”,其中口才了得的 Fowler 更是受 Colbert Report 等脱口秀栏目邀请,在各种电视与网络节目中推广自己的研究 。他们合著的畅销科普读物《大连接》(Connected: The Surprising Power of Our Social Networks and How They Shape Our Lives)奠定了许多读者对于网络研究的初步认知,也进一步将 “三度影响” 打造成如同 “六度分隔” 一般流行的谈资。 可是,这个发现究竟是如何做出的,又是否得到了学界认可?事实上,尽管社会科学界和医学界普遍对 C&F 的发现表示赞叹与重视,但质疑的声音也从未平息,且可称得上刀刀见血。这一切都是因为 C& F 的研究涉及到社会科学界苦恼已久的大问题:区分 “物以类聚” 与 “近墨者黑” 两种机制。 完全相反的解释机制 C&F 的研究,或许会令我们想起 “近朱者赤,近墨者黑” 这句话——两个人相处久了,难免会互相影响,变得愈来愈相似。在社会学中,这种作用被称为 “影响”(influence)、“诱导”(induction)或 “感染”(contagion)。用肥胖做例子,就是胖子的朋友也更可能变成胖子——正是 C&F 的研究结论。 可是我们还听过 “物以类聚,人以群分” 这句俗语,英文中也有类似的说法:“A bird of feather flock together”——同种羽毛的鸟儿会聚在一起。具体到社会现象,就是不同性别、年龄、职业、教育背景、爱好兴趣的人,往往更乐于跟与自己相似的人来往;在社会学中,这被称为 “选择效应”(selection)或 “类聚效应”(Homophily)。也就是说,或许不是胖子让自己的朋友变胖,而是胖子本来就更容易跟胖子成为朋友(显类聚);哪怕胖子的朋友一开始不是胖子,也有可能是因为两人都喜欢吃甜食才特别投脾气(潜类聚)。 两种机制的运作逻辑完全相反:前者由相识而相似,后者由相似而相识。然而它们导致的现象却完全相同,即交往密切的人群往往彼此相像。 且慢,是不是还有第三种可能?设想一下,两个人成为朋友,或许因为他们是同一所学校的学生;而他们都变成胖子,或许是因为学校门口就有一间麦当劳。也就是说,可能根本原因并不在个体身上,而是存在第三种机制——环境因素,同时导致两人的 “相识” 与 “相似”。 再举一个简单的例子:当你观察到杰克与露丝两个小伙伴先后从泰坦尼克号上跳进了海里,你怎么解释这一现象?C&F 的答案或许是露丝受到了杰克的感召,所以模仿了他的行动(感染效应);但事实也许是他们两个原本就都热爱浪漫与冒险,因此才成为小伙伴,所以做出相似的举动毫不出奇(类聚效应);更可能是因为泰坦尼克号就要沉了(环境效应)。 社会科学并非简单观察社会现实或发发问卷就可以交差,要想探索现象背后的真正机理,科学严谨的研究设计必不可少。问题在于,在真实社会中,社会网络、个体特性与环境因素往往紧密相连难分难解,要想剥离开来分别测试其影响力无法排除的阴影机制
其实,自从第一篇论文发表以来, C&F 就面临着来自各个学科的质疑。

胖子的可能性反而会降低!如果将露丝两年前与现在的肥胖状况综合考虑,那么他对杰克的影响几乎为零。 第二,C&F 试图用单向友谊的不对称影响来排除环境效应,但事实上,这个 “不对称” 在统计学上根本不显著。57% 这个数字只是统计估值,严谨来看,C&F 应该有 95% 的信心说这个数字位于区间 6%~123% 之间;而反向影响在统计学上不显著,也就是说无法与 0 区分开来。C&F 的逻辑是,0 小于 6%,因此两个方向的影响之间存在本质区别。但事实上,“无法与 0 区分” 和 “等于 0” 完全是两码事,如果用置信区间表示,C&F 应该有 95% 的信心说这个数字其实位于 -28%~68% 之间——两个区间有大面积互相重叠。因此,C&F 并没有证明单向友谊的影响是不对称的,也就谈不上排除环境效应了。 而如果退一步承认两个数字有显著区别,更糟糕的悖论便出现了:杰克是中心小组成员,所以他是被预测对象,而露丝被视为 “影响者”;但其实这完全是人为划分的。如果反过来思考杰克对露丝的影响,那岂不是恰好相反?也就是说,当杰克单方面视露丝为好友时,他对露丝造成的影响反而更高(57%)? Lyons 进一步分析指出,即使不考虑统计学错误,C&F 的结论也无法区分感染、类聚和环境三种机制。只要一个简单的交友法则就可以让 C&F 的努力化为乌有:任何一个人都指认所有人中跟自己最为相近的人做好朋友。如果这里的“相近”指的是性格,那么造成的就是类聚效应;如果指的是地理位置,那么就是环境效应。显然,这种距离可以是不对称的:杰克认为露丝离自己最近,但露丝身旁可能有距离更近的卡尔;因此,类聚与环境造成的影响当然也可以不均匀。 Lyons 指出,在有关肥胖、吸烟、幸福感和孤独感的至少四篇论文中,C&F 都犯下了一模一样的错误。一旦抽走这一块基石,他们的整个学术大厦都将摇摇欲坠。更令他不爽的是,C&F 用来迅速制造论文的宝贵数据库从未向其他研究者公开,导致无人能够做重复性和检验性研究,这就使他们迅速崛起的名声显得更为可疑。 应该说,Lyons 的批评是十分到位的。其后 C&F 虽针对各路批评做出过反驳,但对于最致命的置信区间的重叠问题并未给出有说服力的解答,只是诉诸直觉:“多次实验均出现相同的趋势,恐怕无法用概率和巧合来解释”。不过,Lyons 太激烈的措辞也让许多人觉得过火了,毕竟 C&F 首次提出通过关系的方向性和影响的不对称性来区分类聚效应和感染效应,这种新思路本身就是一种方法论上的贡献。 ◎ 刘冉 政见观察员 参考文献: Christakis, N. A., & Fowler, J. H. (2007). The spread of obesity in a large social network over 32 years. New England journal of medicine, 357(4), 370-379. Lyons, R. (2011). The spread of evidence-poor medicine via flawed social-network analysis. Statistics, Politics, and Policy, 2(1).

批评者中,最忿忿不平的一位或许是印第安那大学伯明顿分校数学系教授 Russell Lyons。他的批评文章名为《证据不足的医学研究如何通过错误的社会网络分析传播》(The Spread of Evidence-poor Medicine via Flawed Social-network Analysis),发表于《统计、政治与政策》学刊(Statistics, Politics, and Policy)上。他在文中花了大半篇幅述说这篇论文发表的艰辛:曾发表 C&F 论文的刊物无一例外不肯接受批评文章,而不曾发表 C&F 论文的刊物又不愿意发表针对其他刊物文章的批评;当他无奈之下将文章投去一家统计学专业刊物时,编辑又觉得“话倒是在理,可是这个问题不是很重要”!

或许正因如此,最后发表的版本也显得格外愤世嫉俗:Lyons 认为,C&F 的走红说明现在的研究风气存在严重的问题,许多研究者对于统计学盲目依赖、不求甚解,得出的结果自然也站不住脚。

例如,C&F 在分析中纳入前一次调查的数据,认为这样就可以控制类聚程度,仅体现出 “净影响”。但仔细观察会发现,朋友在上一次和这一次调查中肥胖与否,对个体自身肥胖与否的影响是相反的——也就是说,如果杰克的朋友露丝在两年前是个胖子,那么杰克现在变成胖子的可能性反而会降低!如果将露丝两年前与现在的肥胖状况综合考虑,那么他对杰克的影响几乎为零。

第二,C&F 试图用单向友谊的不对称影响来排除环境效应,但事实上,这个 “不对称” 在统计学上根本不显著。57% 这个数字只是统计估值,严谨来看,C&F 应该有 95% 的信心说这个数字位于区间 6%~123% 之间;而反向影响在统计学上不显著,也就是说无法与 0 区分开来。C&F 的逻辑是,0 小于 6%,因此两个方向的影响之间存在本质区别。但事实上,“无法与 0 区分” 和 “等于 0” 完全是两码事,如果用置信区间表示,C&F 应该有 95% 的信心说这个数字其实位于 -28%~68% 之间——两个区间有大面积互相重叠。因此,C&F 并没有证明单向友谊的影响是不对称的,也就谈不上排除环境效应了。

而如果退一步承认两个数字有显著区别,更糟糕的悖论便出现了:杰克是中心小组成员,所以他是被预测对象,而露丝被视为 “影响者”;但其实这完全是人为划分的。如果反过来思考杰克对露丝的影响,那岂不是恰好相反?也就是说,当杰克单方面视露丝为好友时,他对露丝造成的影响反而更高(57%)?

Lyons 进一步分析指出,即使不考虑统计学错误,C&F 的结论也无法区分感染、类聚和环境三种机制。只要一个简单的交友法则就可以让 C&F 的努力化为乌有:任何一个人都指认所有人中跟自己最为相近的人做好朋友。如果这里的“相近”指的是性格,那么造成的就是类聚效应;如果指的是地理位置,那么就是环境效应。显然,这种距离可以是不对称的:杰克认为露丝离自己最近,但露丝身旁可能有距离更近的卡尔;因此,类聚与环境造成的影响当然也可以不均匀。
Lyons 指出,在有关肥胖、吸烟、幸福感和孤独感的至少四篇论文中,C&F 都犯下了一模一样的错误。一旦抽走这一块基石,他们的整个学术大厦都将摇摇欲坠。更令他不爽的是,C&F 用来迅速制造论文的宝贵数据库从未向其他研究者公开,导致无人能够做重复性和检验性研究,这就使他们迅速崛起的名声显得更为可疑。
应该说,Lyons 的批评是十分到位的。其后 C&F 虽针对各路批评做出过反驳,但对于最致命的置信区间的重叠问题并未给出有说服力的解答,只是诉诸直觉:“多次实验均出现相同的趋势,恐怕无法用概率和巧合来解释”。不过,Lyons 太激烈的措辞也让许多人觉得过火了,毕竟 C&F 首次提出通过关系的方向性和影响的不对称性来区分类聚效应和感染效应,这种新思路本身就是一种方法论上的贡献。

可谓难于登天。 可是,能够得到学界认可的研究,一定也在这一方面做出了努力;那么,C&F 是否找到了区分三种机制的方案? 肥胖传染的方向性 C&F 的一系列研究设计与逻辑推导过程都很类似,且依赖于同一个数据库——一项关于心脏健康的大型调查数据。该调查始于 1948 年,约每 2-4 年采集一次数据,包括体检数据与情绪数据(是否感到幸福、孤独、抑郁等);前后跟踪调查了三代人,总计 12000 余人。在如此漫长的调查过程中,为了保证能够持续联系到受访者,访问员记录下了每位受访者的亲人、朋友和同事信息,其中包括一名 “最亲密且并非亲人的朋友”;妙的是,列出的名单中相当一部分人也参与了这项调查。正是这一在原本研究目的之外的独特数据给了 C&F 以灵感,他们整理出了这批手写的笔记,并以此为依据绘出了受访者之间的关系图。 C&F 将其中第二代约 5000 人视为分析中心,列出他们与其他人的关系,通过朋友的各项指标来预测他们的指标。如此一来,对多年来采集的数据经过简单的统计分析就可以发现,这些中心小组成员的健康与情绪状况与其朋友十分类似;朋友的肥胖、抽烟、酗酒、抑郁的问题,也更有可能传染到他们身上。 问题在于,如何知道这背后的机理究竟是感染、类聚还是环境效应? 为排除类聚效应,在数据分析中,C&F 不仅列入了 “朋友” 们同一次调查的身体情况,也列入了上一次调查的数据;也就是说,一切影响都是在控制了上一次调查数据的情况下得出的,可以视为 “最近两年的净影响”。 为排除环境效应,C&F 对友谊标注了方向:如果中心小组成员杰克称露丝为其最好的朋友,而露丝并未说出杰克的名字,那么这段关系就是单向的;如果双方皆称对方为自己最好的朋友,那么这段关系是双向的。结果发现,单向友谊会导致不对称的结果!例如,若杰克单方面称露丝为好朋友,那么一旦露丝成了胖子,杰克也变成胖子的几率就会上升 57%;而反过来,若露丝单方面称杰克为好朋友,那么露丝变成胖子后,杰克变成胖子的几率只会上升 13%,且这个数字在统计意义上不显著,即可以认为不存在。C&F 认为,这种不对称影响证明了:环境并非始作俑者,至少不是唯一的影响因素——因为环境对二人的影响应该是相同的。 此外,为计算 “三度影响”,C&F 采用进行了随机模拟,即在网络结构不变的情况下,将个体的肥胖情况进行了随机重分布,并作为对照组与现实数据进行比较,最终得出肥胖与且仅与三重人际关系相关的结论。 应该说,这个设计是很巧妙的,也与数据库本身得天独厚的条件有关。那么,批评者又立足何处呢? 无法排除的阴影机制 其实,自从第一篇论文发表以来, C&F 就面临着来自各个学科的质疑。 批评者中,最忿忿不平的一位或许是印第安那大学伯明顿分校数学系教授 Russell Lyons。他的批评文章名为《证据不足的医学研究如何通过错误的社会网络分析传播》(The Spread of Evidence-poor Medicine via Flawed Social-network Analysis),发表于《统计、政治与政策》学刊(Statistics, Politics, and Policy)上。他在文中花了大半篇幅述说这篇论文发表的艰辛:曾发表 C&F 论文的刊物无一例外不肯接受批评文章,而不曾发表 C&F 论文的刊物又不愿意发表针对其他刊物文章的批评;当他无奈之下将文章投去一家统计学专业刊物时,编辑又觉得“话倒是在理,可是这个问题不是很重要”! 或许正因如此,最后发表的版本也显得格外愤世嫉俗:Lyons 认为,C&F 的走红说明现在的研究风气存在严重的问题,许多研究者对于统计学盲目依赖、不求甚解,得出的结果自然也站不住脚。 例如,C&F 在分析中纳入前一次调查的数据,认为这样就可以控制类聚程度,仅体现出 “净影响”。但仔细观察会发现,朋友在上一次和这一次调查中肥胖与否,对个体自身肥胖与否的影响是相反的——也就是说,如果杰克的朋友露丝在两年前是个胖子,那么杰克现在变成

◎ 刘冉 / 政见观察员

参考文献:

Christakis, N. A., & Fowler, J. H. (2007). 2007 年起,时任哈佛大学社会学系及医学院教授的 Nicholas A. Christakis(中文名古乐朋,现为耶鲁大学社会学系教授)与加州大学圣地亚哥分校政治学系及医学遗传学系教授 James H. Fowler接连发表一系列研究,在多个领域内同时公布一项重要发现: 个人的许多特征和行为可能通过社会网络 “传染” 身边的朋友,其中包括肥胖、吸烟、酗酒、失眠、嗑药、投票乃至离婚等等;这种影响平均能够跨越社会网络中的 “三度”,亦即传播到 “朋友的朋友的朋友”。 这一发现被简要地称为 “三度影响法则”。两位教授(下文简称 C&F)认为,这种传播可能有两种机制,其一是影响朋友的观念,例如令其更容易接受肥胖的外表;其二是直接影响其行为,例如令其更爱大吃大喝而懒于运动。 或许由于结论简明易懂又耸人听闻,C&F 的研究迅速进入公众视野,甚至成为社会热点话题,登上了《纽约时报》的头版;两位研究者被《外交政策》杂志列入 2010 年度的 “全球百大思想家”,其中口才了得的 Fowler 更是受 Colbert Report 等脱口秀栏目邀请,在各种电视与网络节目中推广自己的研究 。他们合著的畅销科普读物《大连接》(Connected: The Surprising Power of Our Social Networks and How They Shape Our Lives)奠定了许多读者对于网络研究的初步认知,也进一步将 “三度影响” 打造成如同 “六度分隔” 一般流行的谈资。 可是,这个发现究竟是如何做出的,又是否得到了学界认可?事实上,尽管社会科学界和医学界普遍对 C&F 的发现表示赞叹与重视,但质疑的声音也从未平息,且可称得上刀刀见血。这一切都是因为 C& F 的研究涉及到社会科学界苦恼已久的大问题:区分 “物以类聚” 与 “近墨者黑” 两种机制。 完全相反的解释机制 C&F 的研究,或许会令我们想起 “近朱者赤,近墨者黑” 这句话——两个人相处久了,难免会互相影响,变得愈来愈相似。在社会学中,这种作用被称为 “影响”(influence)、“诱导”(induction)或 “感染”(contagion)。用肥胖做例子,就是胖子的朋友也更可能变成胖子——正是 C&F 的研究结论。 可是我们还听过 “物以类聚,人以群分” 这句俗语,英文中也有类似的说法:“A bird of feather flock together”——同种羽毛的鸟儿会聚在一起。具体到社会现象,就是不同性别、年龄、职业、教育背景、爱好兴趣的人,往往更乐于跟与自己相似的人来往;在社会学中,这被称为 “选择效应”(selection)或 “类聚效应”(Homophily)。也就是说,或许不是胖子让自己的朋友变胖,而是胖子本来就更容易跟胖子成为朋友(显类聚);哪怕胖子的朋友一开始不是胖子,也有可能是因为两人都喜欢吃甜食才特别投脾气(潜类聚)。 两种机制的运作逻辑完全相反:前者由相识而相似,后者由相似而相识。然而它们导致的现象却完全相同,即交往密切的人群往往彼此相像。 且慢,是不是还有第三种可能?设想一下,两个人成为朋友,或许因为他们是同一所学校的学生;而他们都变成胖子,或许是因为学校门口就有一间麦当劳。也就是说,可能根本原因并不在个体身上,而是存在第三种机制——环境因素,同时导致两人的 “相识” 与 “相似”。 再举一个简单的例子:当你观察到杰克与露丝两个小伙伴先后从泰坦尼克号上跳进了海里,你怎么解释这一现象?C&F 的答案或许是露丝受到了杰克的感召,所以模仿了他的行动(感染效应);但事实也许是他们两个原本就都热爱浪漫与冒险,因此才成为小伙伴,所以做出相似的举动毫不出奇(类聚效应);更可能是因为泰坦尼克号就要沉了(环境效应)。 社会科学并非简单观察社会现实或发发问卷就可以交差,要想探索现象背后的真正机理,科学严谨的研究设计必不可少。问题在于,在真实社会中,社会网络、个体特性与环境因素往往紧密相连难分难解,要想剥离开来分别测试其影响力The spread of obesity in a large social network over 32 years. New England journal of medicine, 357(4), 370-379.

Lyons, R. (2011). The spread of evidence-poor medicine via flawed social-network analysis. Statistics, Politics, and Policy, 2(1).

  评论这张
 
阅读(1810)| 评论(2)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017