编者按:5.20是国际临床试验日。1747年5月20日,詹姆斯·林德做了人类历史上第一个对照实验,标志着检验药物有效性的方法从蒙昧走向科学。请读苦丁山《林德和第一个科学的药物疗效检验》。
麦哲伦有个货真价实的“史上第一”记录,就是首次环球航海。这个“史上第一”的含金量,不是现在媒体和微博圈里那些“史上第一”能比的。
不过,他这个“史上第一”的代价也高得出奇。不是说它花多少时间。耗时三年固然不短。但真正惨烈的是生命的损耗:特立尼达号出发的时候有270人。三年之后完成环球旅行回到西班牙时,总共只剩下18人。除了一部分是航海过程中因为跟人打架而丧命,绝大多数船员是死于坏血病。
为什么他们会患坏血病?因为他们缺乏维生素C。
为什么会缺乏维生素C?因为海上航行没有新鲜蔬菜,也没有新鲜水果。没有这两种食物,就没有维生素C的来源。
缺乏维生素C为什么会有这么严重的后果?
因为维生素C是参与人体合成胶原蛋白的关键成分。
对。维生素C才是真正影响胶原蛋白合成的要素。人一辈子不吃猪蹄没问题。人一辈子不吃胶原蛋白粉没问题。但是在有维生素片之前,人不吃新鲜蔬菜水果超过六个星期,身体里的胶原蛋白体系就开始崩溃,就会出现牙龈肿胀出血,然后牙齿松脱,然后是大面积皮下出血和关节疼痛僵直。如果一直拖延下去,最后就是死亡。
但是这个是我们现在所知道的医学知识。在麦哲伦那个年代,也就是15世纪的时候,没人知道坏血病是因为这个引起的。他们只知道出海的人,在海上呆了大约两个月之后,就会出现上面说的这些恐怖症状。
那个年代的船员不止一次讲述这样的离奇故事:在茫茫大海上看到一艘无目的飘泊的船。登船之后看到全体船员死亡。身上没有暴力伤痕,如果仔细看,可以看到尸体都有肿胀的牙龈和脱落的牙齿。
关于坏血病本身的观察已经很有历史了。希波克拉底在两千五百年前记载的一些疾病,从症状看应该就是坏血病。欧洲人在十字军东征期间,对坏血病有明确的记载。但是那时还没有化学分析技术,无法识别出具体是什么导致坏血病的,所以治疗的方法也就是盲目的尝试各种草药。偶尔有局部成功的案例,比如吃西洋菜或是柑橘肉之后症状好转,但是当时那些“体液”或是“气”之类的医学理论都是一些飘渺的臆想,不能从这些成功案例里提取真正的关键因素,于是也就没能形成系统的治疗方法。有个统计数据:在找到真正有效的坏血病治疗药物之前,英国海军舰队因为坏血病而死亡的水兵,比海军历次战斗里战死的水兵的总数还要多。
士兵不断减员,杀手却不知道是谁。这让英国海军很郁闷。
郁闷多年之后,终于有人试图挑战这个杀手了。
挑战的是当时英国海军里的一个军医,名叫做詹姆斯-林德(James Lind)。
1716年,也就是《康熙字典》编撰完毕的那一年,林德出生在苏格兰的爱丁堡。跟发明牛痘接种的爱德华-詹纳一样,林德入行也是从外科学徒开始。23岁上,林德取得外科医生资格,之后到英国海军做军医。
既然在海军行医,寻找治疗坏血病的治疗方法,自然是林德的首要任务之一了。
当时欧洲的医学知识跟亚洲非洲一样,都是一些无法验证的朦胧概念。比如,当时对坏血病解释说,这是一种腐败现象。什么引起这种“腐败”就不得而知。然后,当时的观点是认为,用带酸性的东西可以治疗坏血病。
身处那个年代,林德所学到的知识并不比同僚要胜出多少,但是他想能做点什么,来验证一下这种“酸能治疗坏血病”的说法是不是真有这么回事。
于是,1747年,31岁的林德设计了这么一个检验的方法。他把船上的坏血病人分成几个组,分别在他们的饮食里添加一些不同的辅食,然后观察病情的变化。哪一组的病人有好转,就说明他们吃的辅食是有治疗作用的。
实验是从出海之后两个月之后开始,当时发现坏血病都是这么久之后开始出现。
林德挑出12个症状最明显的船员,把他们分作6组,每组2人。这这12个人,每天吃的正餐都相同。不同的是他给每个组添的辅食。这六个组,每天的饮食里添加的辅食是这样的:
第一组:一升苹果酒
第二组:25滴硫酸,加入饮用水里
第三组:6勺醋
第四组:240毫升海水
第五组:两个橘子,一个柠檬
第六组:一种辣酱加大麦茶
这里面大部分东西都含酸。海水不含酸。林德选它或许是因为这东西对海员来说唾手可得,如果真能有用就太方便了。辣酱里可能含有一些醋。至于大麦茶就不知道林德是怎么选中的了。从现在我们对它的了解来说,大麦的维生素B含量颇高,对脚气病有好处。但是大麦里的维生素C含量基本是零,对坏血病是没有帮助的。当然,那时候大家都不知道坏血病到底由什么引起,也没有化学分析知识,那么有这些看似不沾边的选择混在里面也不是很奇怪。跟喝尿避孕或是吃牛虱子治疗天花相比,林德的海水和大麦茶其实还不算是太离谱吧。
实验做到第六天就不得不中断,因为船上没带这么多水果,到第六天橘子和柠檬都吃完了。不过,实验不能说是白做了。到第六天的时候,吃橘子柠檬的那两人,其中一位已经康复到可以正常工作,另一位也差不多完全康复。
其他组呢,只有第一组喝苹果酒的两个人略有好转。
林德把实验结果写成论文发表了,但是并没有引起重视。主要原因是,他太局限于当时的“酸性”原理,用酸来解释橘子和柠檬的疗效,结果被人质疑:如果是因为酸性在起作用,为什么喝醋和硫酸的那两组没有疗效?
而且,他后来试图改进橘子疗法的时候,做出的努力适得其反。为了便于让海员携带,他把橘子榨汁,然后加热浓缩。糟糕的是,维生素C很怕热,一加热就被破坏了。所以他建议的喝浓缩橘汁的方法没有得到预期的疗效。
本来已经他都已经摸到了一条大鱼,只因为当时医学知识太原始,研究条件太落后,林德没能判断出橘子柠檬里真正起作用的成分,结果就让这条大鱼溜走了。
林德的实验没能马上确定柑橘是治疗坏血病的最佳“食疗”,但是他在医学史上却被列为一个重要人物。因为,他的这个实验,是历史上第一次尝试用系统方法检验药物疗效——并且做了完善的记录。
在那之前,有没有人做过类似的系统检验呢?
不知道。因为,没有记录。
以前的文献,有各种医书记载各种秘方,比如兔子肝烧成灰,吃了就可以生男孩,或是雄黄香囊挂身上可以让女胎变男胎之类的。但是这些秘方是怎么发现的呢?没有记载。
为什么没有记载,或许有两种可能。第一,古人没有意识到这样的系统检验才能可靠的判断一种药物的疗效。他们只是凭主观感觉来评判一种东西是不是具有某种“药性”(神农尝百草就是这种探索方式的经典代表),然后用这种判定做指导,在病人身上随机尝试,碰巧吃到某种东西之后病情好转,他们就把这样的东西当作有效药记录下来。这种随机操作不能排除诸多偶合因素的干扰,所以是靠不住的——所以传统医学的治疗方法都只能依靠安慰剂现象来寻找生机。
第二种可能就是,有些古人或许也想到了用系统检验的方法来验证一种新药,于是真的找到某种有效药。这就是说,他的这个做法是科学的,正确的。正确的意思就是可以重复的:别人如果照他的方法来做,也可以得出同样的结果。
这个可重复性,在现代科学里是个基本要求。因为,只有可以重复的结果,大家才承认是定理而不是巧合,于是就可以成为科学结论。
但是在古代,不是每个人都喜欢这种可重复性的。因为,这就意味着别人采用类似的方法也可以找到有效药——于是自己的方子就不再是独家秘方。
那他就不能牟取暴利了。
于是,虽然他做过系统检验,但是对检验方法秘而不宣。
是不是真的有这种事发生过?我们没法知道。如果真的有人这么干,那就是说他根本不会留下字迹来让别人发现真相。
不过,从传统医学里的有效药无限趋近于零的现实来看,第二种可能性不是特别高。
简而言之,就可以查到的文字记录来看,在林德之前,遍观五大洲,就没有人尝试过用科学的方法检验药效。
当然,我们前面说林德采用了“系统方法”来检验药效,是相对于那个时代而言。跟后来的方法对比,他的方法还很原始粗糙,但是意义不减,因为他开启了“临床检验”的先河。
什么叫“系统方法”?就是说,要把各种能想到的排除伪疗效的手法全部运用到实验里。
林德的方法里,有哪些科学成分?我们来看看。
第一,他不是只用一个病人做治疗,而是同时用12个病人。在现代研究方法学里,这个概念叫做“大样本”。大样本的意义在于能够减少意外因素的干扰。如果只用一个病人,这个病人有可能是误诊,不是真的坏血病而只是口腔溃疡。如果是这种情况,你就算只给他喝白开水,过几天他的牙龈也就不肿了。但是这不能证明白开水可以治疗坏血病。或是这个病人患病不是因为吃不到水果,而是因为胃肠有问题,不能吸收维生素C。那么你给他吃多少橘子都不行,必须直接注射才可能解决问题。而这种情况并不能否定“橘子可以治疗坏血病”的结论。为了避免这些干扰情况,就需要找来多个坏血病人,同时治疗。毕竟这么多人,个个都误诊或是个个都有胃肠吸收问题的可能性是非常低的。
第二,实验对象分成若干个组,以便对比治疗效果。这就是“对照组”概念的雏形。传统医学认定一种新药有效的时候,最大的问题就在于没有用对照组来排除伪疗效,只是把某种新药不断试用于某个病人身上,看到病情好转就认为是有效了。这些“疗效”,一旦用对照组来检验,绝大多数结论都会被推翻。用一个最简单的例子来说吧,让一个感冒病人吃板蓝根,几天之后他的感冒好了,一个古代郎中就可以据此下结论,说板蓝根治好了感冒。可是如果你用两组感冒病人,一组吃板蓝根,一组不吃,你就会发现,两组病人其实都是3-5天感冒痊愈。所以那个板蓝根只不过是让病人觉得“我多少吃了点什么”而已。这样的实验里,不吃板蓝根的那个组,就叫做对照组。各种传统医术和民间秘方,只要用对照组一检验就可以知道都是无效的。所谓的疗效不是因为人体自身康复功能就是因为安慰剂效果。
第三,他让这6组12个人,除了实验设计里要试用的六种待检验辅食不一样之外,其他的条件都尽量的一致:正餐的内容一样,生活起居规律一样。六个组里病人的病情轻重大致对等。唯一不一样的就是每天所提供的辅食。那么,如果疗效有区别,就只能用这些辅食来解释了。
第四,针对同样的一个实验目标(这里就是坏血病),用若干种不同的(但是根据现有理论,似乎是很有希望的)备选药物来进行“攻击”,对比变化,找出最有效的药物。这有点乱枪打鸟的味道,不过在对各种口口相传的“药物”疗效还一派朦胧的年代,这种做法可以说是能以最高的效率来证明或是证伪那些“传统药物”的效果的。实际上,即使在技术高度发达的今天,这种做法仍然是探索新药的一种重要方法。如今药物研究的尖端技术之一,高通量筛选,其实就是大规模的排枪扫射。这种方法一天可以检验十万种待选药物成分。
林德的这个实验没有马上得到正确的结论。林德的实验方法,以现在的标准来看,也还很粗糙。但是他的这种以系统的科学的方法来检验药效假说的思路,启发了后人,于是越来越多的科学家完善了这些检验原则,使得药效检验方法越来越可靠。其中最重要的原则有这么几点:
大样本:样本数足够大,才能排除个体差异导致的意外。比如要检验一种药是不是可以让人长高,如果只找一个人来试用,而这个人碰巧是发育之前的姚明,这样的实验结果就会得出错误结论。
随机:样本选取应该随机。就是说,不能只挑选具备某种品质的实验对象。比如,如果要检验一种药是不是能让人有力气,然后选来做实验的人全部都是特种兵,这样的实验设计就毫无意义了。
对照组:必须有对照组。实验组和对照组除了要检验的那个假说(比如橘子能治疗坏血病)需要区别对待(实验组吃橘子,对照组不吃),其他的条件都要尽量对等:性别分布相似,年龄相似,生活习惯相似,饮食相似,等等。
量化:测试的标准必须是可以测量的。比如坏血病的检查,应该包括牙龈肿胀是几个毫米,甚至牙龈的颜色也可以用比色表来量化。能量化的检验才可能提供可靠的结论。无从量化的描述,比如“皮肤比以前更年轻了”,能让没有科学训练的老百姓动心,但是得不出科学的结论。
可重复性:真正科学的结论,最根本的特征就是可以重复。谁号称一个验证得到了阳性结果,那么别人照着他描述的方法再做一遍,应该也能得出同样的结果。所以科学检验都必须有完整记录。拿不出实验记录,却断言“我们已经通过独家操作去掉了这种成分的毒性”,那只能是忽悠。
这就是林德的故事了。有不少说林德故事的文章,出于对他的敬意,把发现橘子可以治疗坏血病的功劳完全归功于林德。这个其实有点感情用事。林德因为受当时错误医学理论的限制,并没能从他的实验里得出明确的结论。他自己也对实验结果的“不一致”感到困惑,因为他想不通为什么醋和硫酸不能有疗效。因为这种困惑,他当时并没有高调坚持自己的“橘子可以治疗坏血病”的观点。是后人重新实验之后,确认橘子就是能有这种功效,海军才重新注意到林德的发现,于是在他人已经去世之后才给了他崇高的荣誉。
我的观点是这样:林德没能从那个实验里发现橘子的治疗价值,但是这个挫败无损于他的荣誉。我认为他最大的功劳不是发现橘子的疗效,而是引领了科学检验药物疗效的方法。上面提到后人重新实验,证实了橘子的疗效,而后人所做的实验,正是按照他开创的这种方法来做检验的——于是能有效的证明了橘子确实可以治疗坏血病。
对于林德来说,没能证实橘子的治疗功效,大致相当于失去了一条鱼。而他开创了药物疗效的科学检验方法,可以说相当于找到了一种全新的打渔技术。林德当时没能用这种打渔技术打到那条大鱼,并不是说他的方法不对。他的挫败只是因为历史条件的限制,而且他自己对这种全新打渔法也还没太熟练掌握。人类历史上无数革命性的科学技术和科学研究方法,在刚刚诞生的时候都是很粗糙的。但是对于这些技术和方法来说,最珍贵的不是后来的发展和完善,而是当初有人能“想到这一点”。
林德就是这样的一个人。他想到的系统检验药物疗效的方法,让医学摆脱了个人感悟时代,走进了科学验证时代。这样的检验技术,让医学界能摒弃那些谬传几千年的无效古方,探索出真正有效的现代药物。
转载自《新语丝月刊》2015年5月号(第256期)