三种判断研究是否胡说八道的方法

   日期:2024-10-23     来源:本站    作者:admin    浏览:87    

  

  

  想了解亚瑟的最新作品吗?注册,每次有新专栏出现时都会收到一封电子邮件。

  对于社会科学来说,我们生活在一个有趣的时代。在过去的几十年里,社会心理学和行为经济学等学科似乎解开了人类生活的许多谜团,学者和非专业人士都对他们所揭示的东西欲罢不能。记者们也乐于了解到,比如,原本正派的人被赋予了对他人的专权,是如何变得残忍甚至虐待他人的——正如著名的斯坦福监狱实验所宣称的那样,该实验要求志愿者模拟囚犯和狱警的角色。每个人都对研究人员设计的这种巧妙而引人注目的研究方式感到高兴。

  然而,最近社会科学界陷入了争论的泥潭。研究人员自己也开始注意到,许多著名的实验已经被证明是错误的,比如斯坦福监狱实验,或者根本无法复制。2015年,在《科学》(Science)杂志上发表文章的学者们复制了三份极具影响力的心理学期刊上发表的100项实验,发现只有36%的实验结果与最初的发现一致。

  更糟糕的是,出现了多起有关不道德数据操作的指控,其中一些已得到证实。不当行为包括所谓的p-hacking——处理数据以寻找虚假的相关性,并将其作为有效结果发表——甚至是彻头彻尾的欺诈,即研究人员修改数据以符合预先设想的结果。

  对于许多非专业人士来说,一个自然的结论是对该领域的严重怀疑:人们一定会怀疑,基于行为实验的研究是否完全不可信。我明白,但我仍然不同意整个事业已经失去信誉的说法。作为一名学术社会科学家,更重要的是,作为《大西洋月刊》读者这类研究的仲裁者,我想提供一个幕后的视角,展示研究是如何运作的,为什么会出错,如何解读,什么值得信任,什么值得忽视。

  不正当的研究并不局限于社会科学。自然科学也面临着类似的困难。斯坦福大学(Stanford University)的医学研究员约翰?约阿尼迪斯(John Ioannidis)将这一问题归因于一系列研究缺陷:实验规模太小,难以信任;由于数学上的花招,结果似乎有效,但实际上毫无意义的情况;实验设计差;而最根深蒂固的是,学术偏见是由追求特定结果的职业激励造成的。

  这些激励措施是残酷的。在某些领域,教授需要发表数十篇研究论文才能有机会获得终身职位(如果没有终身职位,他们通常会被扫地出门)。想象一下,你在大学和研究生院学习了10年,然后又花了10年时间在研究上,同时还要承担沉重的教学负担,结果却不得不把你的职业生涯押在大学委员会的决定上。正如一名研究人员在政治科学谣言(Political Science Rumors)——一个该领域的学者可以公开交流的匿名留言板上所写的那样,“终身教职是一个失去人性的过程,因为它把我们当作学徒,直到我们至少30多岁,而且往往远远超过40岁。”虽然我自己对终身教职的追求是多年前的事了,但我清楚地记得每周在一间没有窗户的办公室里工作70个小时,以及随之而来的巨大压力。

  在顶尖大学,即使是发表的研究成果得到适当执行,也不够好。这个话题也必须是聪明的,理想的结果应该是令人惊讶的。狗咬人的经验证据并没有得到太多的信任;一项巧妙的实验揭示了证据,表明实际上,男人咬狗的几率是73.4%——现在我们正在谈论。

  也许不足为奇的是,这种以吸引人的反直觉为中心的冲动会导致问题。2019年一篇题为《欺骗还是灭亡?》在《研究政策》杂志上发表的一篇文章中,研究了学术界偷工减料或直接作弊的动机。该报告的作者指出,尽管胡萝卜可以鼓励高质量的高产工作,即使是在表面上冷静的研究中,但大棒可以阻止错误或不当行为。但学者们也写道,研究中的错误和不当行为很难被发现,这有效地降低了调查它们的能力。这意味着胡萝卜远大于大棒,可想而知会影响工作的完整性。

  任期本身并不一定能消除有问题的激励机制。高级研究人员很容易成为傲慢的牺牲品,无法寻求建议和建设性的批评。研究还表明,在某一领域拥有更多专业知识的人,在收到“不肯定的反馈”时,往往比经验不足的人反应更差,他们会变得更加迂腐——换句话说,他们不想听到自己错了。在一个行为科学家可以成为学术界以外的超级明星的时代,风险也会增加,因为他们激动人心的非正统发现,他们可以获得演讲机会和出书机会。

  我不相信大多数社会科学的实验研究是错误的,在我的职业生涯中,我很幸运能与一丝不苟的同事和合作者一起工作。然而,我对我在本专栏中引用的研究非常谨慎,除了我们仔细的例行事实核查过程之外,正是因为上面描述的问题。在每周的准备工作中,我通常会了解一个研究领域的概况,然后仔细阅读10到12篇相关的学术文章。当我决定用什么来做我的论点时,我首先看研究设计的质量,利用我的学术训练。然后我遵循三条基本规则。

  1. 如果一件事好得令人难以置信,那它很可能就是真的。

  在过去的几年里,三位社会科学家——uri Simonsohn, Leif Nelson和Joseph simmons——因为他们的调查发现了错误或伪造的研究结果而出名。为了证明许多看似“合理”的发现是不可信的,他们对一组特定的数据进行了分析,直到它显示了一个显然不可能的结果:听披头士的歌曲“当我六十四岁时”真的会让你更年轻。

  所以如果一个行为结果非常不寻常,我就会怀疑。如果它令人难以置信或违背常识,我就会完全避开这个发现,因为它是错误的风险太大了。我喜欢把行为科学纳入我所谓的“祖父母测试”:想象一下,把结果描述给你那些见识广博的年长亲戚,然后得到他们的回应。(“嘿,奶奶,我发现了一项很酷的新研究,表明不忠会导致更幸福的婚姻。你觉得怎么样?”)

  2. 让思想慢慢变老。

  我倾向于相信一个特定的研究发现是最近的。20多年前发表的一项研究通常太老,无法反映当前的社会环境。但是,如果一个发现太新,它可能到目前为止还没有得到充分的审查,而且没有被其他学者复制或粉碎。偶尔会有一篇全新的论文给我留下深刻的印象,因为它执行得很好,很有道理,值得我引用来说明一个观点,我也会用它,但我通常更愿意接受一些新的研究,它们是我正在研究的领域中更广泛的结果模式的一部分。我保存了一个文件(我的“酒窖”),里面都是我信任的最新研究成果,但我想在把它们用于专栏之前,让它们成熟一点。

  3.。有用胜过聪明。

  这种不正当的动机并不仅仅局限于学院。许多科学新闻更看重新颖性,而不是实用性,他们报道的研究结果是,当有人试图复制这些研究时,这些研究更有可能失败。这不仅会导致困惑,还误解了行为科学的意义,即提供的不是寓教于乐,而是能够提高幸福感的见解。

  我很少写专栏,因为我发现一个有趣的研究。相反,我遇到一个有趣的话题或想法,然后把它写下来。然后我根据各种研究和证据去寻找答案。这让我倾向于有用的研究,而不是聪明的研究。

  除了检查研究的方法、数据和设计之外,我觉得这三条规则在一个研究不完美的世界里非常有效。事实上,它们超越了我的工作方式;它们实际上帮助指导我如何生活。

  在生活中,我们总是被时尚和潮流所困扰——新的行为方式、思考方式和为人方式,通往我们想要的东西的捷径。无论是在政治、爱情、信仰还是健身方面,一些与直觉相悖的热门新研究总是要求我们抛弃旧方法,接受最新的智慧。

  我相信个人的进步。这就是我写这个专栏的原因,我想我的生活中也有过这样的经历。但我也知道,我们痴迷于新奇和技术的文化充斥着糟糕的想法和错误的信息——相当于p-hacked的结果、错误的发现和彻头彻尾的个人利益欺诈。

  所以,在生活和工作中,当我看到一股潮流经过时,我总是会问,这是不是好得令人难以置信?我让文化时刻或社会趋势老化一段时间。然后我考虑它是否有用,而不仅仅是新颖。也许这段停顿会让我显得有点老成——但我很少失败。

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行