依据临床证据对13种流行健康实践进行分级评估——什么有效、什么被高估,以及6.8万亿美元产业在何处脱离证据进行销售。
全球健康研究院(Global Wellness Institute)是产出最常被引用市场数据的行业机构,将"健康"定义为涵盖十一个部门:身体活动、健康饮食与减重、美容与个人护理、心理健康、传统与补充医学、公共卫生、健康旅游、健康地产、水疗、温泉与矿泉、职场健康[1]。这一总额由个人护理与美容、健康饮食和身体活动占主导。然而增长最快的部分集中在心理健康类应用、采用所谓"结构-功能宣称"的膳食补充剂,以及一系列介于医学与生活方式之间的诊所服务:静脉输液、高压氧治疗、肽类注射、全身核磁共振、冷水浴、远红外桑拿。
该行业的经济意义已成结构性。2024年,健康产业占全球GDP的6.1%[1]——与全球汽车制造业相当。在美国,该行业从2023年到2024年增长了7.9%,超过GDP增速三倍以上。自2013年以来,健康产业规模翻了一番。投资者叙事具有可持续性:销售耗材(补充剂、果汁、粉末)、耐用消费品(红光面板、冷水浴桶、立式办公桌)、服务(冥想应用、水疗访问、输液诊所)和内容(播客、书籍、课程)。它拥有名人引擎、网红经济,并日益拥有风险投资管道。
不过,健康产业在证据层面并非铁板一块。✓ 已证实 运动可降低全因死亡率;地中海饮食模式可减少心血管事件;睡眠剥夺会损害认知。这些事实并无争议[11]。其他要素——桑拿、特定冥想实践、某些适应原(adaptogen)植物——在设计良好的试验中显示出临床上有意义但适度的效果[6][7][11]。第三类——为健康人提供的静脉注射维生素、蓝光过滤眼镜、玉石阴道蛋——已被检验且未显示具有临床意义的效果,或者根本未经检验[3][5][15]。
全球健康研究院将2024年的健康经济规模估计为6.8万亿美元——而全球制药业约为1.8万亿美元[1]。从单个行业看,健康产业目前已超过旅游、体育与信息技术。然而,药品须经过分阶段的临床试验、美国食品药品监督管理局(FDA)的上市前审查、上市后监测以及处方者责任。6.8万亿美元健康市场的绝大部分则不面临上述任何要求。
不对称性才是核心叙事。一个1.8万亿美元的行业必须在产品到达患者之前按照监管标准证明有效性与安全性。一个6.8万亿美元的行业仅需避免明确的疾病治疗宣称。其结果是这样一个市场:两种包装相似、营销方式相似、价格相近的产品,可能其一已在数十年间于数万患者中接受过检验,另一种则可能从未被检验过。消费者很少能够辨别二者。
本报告依据临床证据评估十三种最受欢迎的健康实践。分类并非任意,而是遵循Cochrane协作网与主要医学机构所采用的框架。"已证实"等级(重复验证、大样本、独立资助、具有临床意义的效果);"有力证据"等级(数据一致但质量中等或可外推性有限);"有争议"等级(效果存在分歧、方法学问题或与产业资助相关的利益冲突)[3][8]。该框架之所以重要,是因为健康产业的主要商业优势并非虚假,而是模糊。在营销中,对30%的使用者起效的实践听起来与对90%起效的实践无异。消费者、监管机构和临床医生都需要一份按证据等级分级的地图。
本报告其余部分将构建这一地图。
为什么健康类宣称无需证据
DSHEA架构与"结构-功能宣称"漏洞
根据1994年美国《膳食补充剂健康与教育法》(Dietary Supplement Health and Education Act, DSHEA),美国食品药品监督管理局(FDA)无权要求对膳食补充剂进行上市前审批——✓ 已证实 [12]。只要成分在1994年之前已经销售,或者符合"结构-功能宣称"的标准,制造商甚至无需通知FDA即可将产品推向市场。全球大多数健康产品都继承了这一相同的监管框架:关于支持身体结构或功能的宣称无需达到与疾病治疗宣称相同的证据水平。
这一法律架构带来了重大后果。在美国,一种药物必须通过三期人体临床试验,证明优于安慰剂的有效性,并确立可接受的安全性,方能上市[12]。平均开发成本:10亿至20亿美元。平均周期:十至十五年。膳食补充剂则完全无需任何临床试验。制造商对其成分的安全性负责,但无义务在上市前与FDA共享相关证据。FDA仅在能证明某产品存在"对受伤或疾病构成重大或不合理风险"时才能在上市后采取行动——这是一个高门槛的证据标准,而该机构在大规模层面很少能跨越[12]。
使健康企业无需药物级证据即可作出带医疗暗示的宣称的机制,正是"结构-功能宣称"。药物宣称——"治疗高血压"——会触发上市前审查;结构-功能宣称——"支持心血管健康"——则不会。两种表述在语义上的距离很小,但在监管上的距离巨大。制造商围绕第二种表述构建营销。法定免责声明——"本声明未经FDA评估。本产品不用于诊断、治疗、治愈或预防任何疾病"——往往以小字呈现,消费者很少阅读[12]。
结构-功能漏洞随后被第二个机制放大——健康类服务。静脉注射维生素、冷水浴、远红外桑拿疗程、红光面板,并非作为产品消费,而是作为服务提供。服务的监管发生在其提供地——在美国主要是州一级——且各地标准差异巨大。"医美水疗中心"在某些州可能由注册护士在医师监督下经营,而在另一些州则由无执照的技术员经营。FDA于2024年1月发布的针对未受监管医美水疗中心静脉混合液的警示,指出存在非无菌配制、消毒不足及无执照施治者等问题[5]。联邦层面并不存在执业许可制度。
第三个机制是司法管辖的碎片化。FDA监管补充剂的安全性;联邦贸易委员会(FTC)监管广告宣称;各州总检察长处理消费者保护案件;美国疾病控制与预防中心(CDC)追踪不良事件。上述各机构都不具备全面权限。FTC近年最具代表性的执法行动——2024年向Prevagen消费者退款2760万美元,并向被Sobrenix"减少酒瘾"宣称误导的53.6万名消费者退款——仅追回收入的一小部分,且在产品上市数年之后才到来[14]。面对6.8万亿美元的对象,执法是被动且资源不足的。
一项药物宣称——"降低血压"——会触发10亿美元规模的强制性试验。一项健康宣称——"支持健康循环"——则不会触发任何要求。两种产品可能以相似的包装、相近的价格和相似的隐含益处并排销售。消费者无法可靠地区分二者。结果是,监管架构将词语而非效果作为消费者保护的相关单位。
"DSHEA体现的是经过审慎考量的政策"这一论点,由补充剂行业以"维生素、矿物质和传统草药并不需要药物级别测试"为由进行辩护。该论点对于以已确立的剂量数百年来使用的物质具有表面上的合理性。但对于新型成分、浓缩提取物、超大剂量和复方组合——而这些目前都在同一监管框架下销售——该论点便难以成立。茶饮中120毫克的南非醉茄并不是同一种产品作为一种作为压力管理而出售的1000毫克标准化提取物[7]。DSHEA对二者一视同仁。
在美国之外,情况复杂多样,但对于寻求循证产品的消费者而言,并不更令人安心。欧洲食品安全局(EFSA)依据《(EC) 1924/2006号条例》要求对健康声称进行上市前评估,并拒绝大多数声称——已提交的逾4.4万项健康声称中,超过80%因证据不足被驳回。然而,对未经授权声称的执法仍由各国主管,且执法力度参差不齐。在英国,补充剂声称由广告标准管理局(ASA)管辖,存在类似漏洞。澳大利亚治疗用品管理局(TGA)则采用较为宽松的"列名药物"审查,要求安全性证据,但接受基于传统使用的有效性声称。
三十年来的模式是一致的:监管者袖手旁观;产业繁荣;针对具体宣称的证据不断累积;执法行动则迟至数年之后到来,且仅追回收入的一小部分。该架构并未制造系统性的欺骗,而是制造了系统性的模糊——而在商业意义上,这种模糊本身就是产品。
有三项实践达到了最高的证据等级。第一是间歇性禁食的限时进食形式。2026年3月发表于《eClinicalMedicine》的一项伞状综述综合了随机对照试验的系统综述与荟萃分析,得出结论:该方式在六个月时可带来5.5至6.5公斤的体重下降,并伴随空腹胰岛素与糖化血红蛋白(HbA1c)的下降[8] —— ✓ 已证实。具临床意义的发现在于:间歇性禁食不是什么——它并不优于持续性热量限制。其益处与传统饮食相当;机制似乎是热量摄入的减少,而非禁食本身诱导的代谢转变。
第二是定期桑拿——但证据指向的是传统芬兰桑拿,而非红外桑拿。《Mayo Clinic Proceedings》对芬兰前瞻性队列数据的综述发现,每周4至7次的桑拿与每周仅一次相比,在调整已知混杂因素后,与心血管死亡率降低50%相关[11]。可信的机制是反复的血管舒张、全身血压下降、内皮功能改善以及自主神经系统的调节。效果显著且生物学上自洽。激进市场化"细胞排毒、减重和免疫增强"的红外桑拿市场,并不共享这一证据基础。红外桑拿试验更小、更短,主要针对心血管病人群。
对评估Headspace与Calm的随机对照试验所做的系统综述发现,75%的Headspace试验相对对照组显示抑郁减轻,效应量通常处于小到中等范围(Cohen's d 0.2–0.5)[6]。同一综述在相当比例的研究中记录了产业资助、作者利益冲突与选择性结局报告——这意味着效果是真实的,但其量级很可能被高估。
第三是通过经过试验检验的应用提供的正念冥想。Headspace是被研究最多的应用,在评估其效果的随机对照试验中,有75%显示抑郁症状减轻[6]。效应量适度——Cohen's d通常介于0.2至0.5,处于"小到中等"区间——但研究间的一致性足以构成有力证据。值得注意的限定是:相关文献并非独立于产业;相当一部分试验由Headspace或关联实体资助、共同署名或协助开展。2022年JMIR Mental Health系统综述明确指出了这一利益冲突模式[6]。可信的效果是真实的;其量级很可能被高估。
立式办公桌——最接近"循证"的职场健康干预——在随机试验中可使每日坐立时间持续减少60至90分钟,相应地,自报的腰背与颈部疼痛在三至六个月时有所改善。心代谢获益虽可测量,但很小:站立比坐着多消耗约0.15千卡/分钟,整个工作日大约多耗50千卡。该干预的价值在于减少长时间静态姿势,而非燃烧热量。悉尼大学2024年关于长时间站立的证据——连续站立超过两小时会增加循环系统问题——细化而非否定了原有建议。当前循证处方是"轮换",而非"持续站立"。
"益处与持续性热量限制相当,并不更优。所观察到的差异并不具临床意义。尽管间歇性禁食存在多种方式,但目前并无确切证据表明哪种方式最为有效与安全。"
——Patikorn等,《间歇性禁食的伞状综述》,eClinicalMedicine(Lancet),2026年3月 [8]适应原植物——尤其是南非醉茄(ashwagandha)与Rhodiola rosea——位于"有力证据"与"有争议"之间的边界。七项关于南非醉茄的随机对照试验涵盖了491名成年人(全部来自印度),结果显示在6至8周内,主观感受到的压力、血清皮质醇与自报焦虑症状均有所下降[7]。欧洲药品管理局(EMA)于2011年批准了红景天用于"压力相关疲劳"的传统使用。证据是初步但一致的。但保留意见也很重要:研究人群较为单一,疗程较短,效应量适中,并有南非醉茄诱发肝毒性的罕见病例报告[7]。该产品类别比大多数健康类补充剂得到了更好的刻画,但营销远远超出了试验所证明的范围。
光生物调节疗法——红光与近红外疗法的临床名称——在面向消费者的健康类别中拥有最坚实的皮肤科证据。2025年《Journal of the American Academy of Dermatology》的多学科共识为寻常痤疮、雄激素性脱发(毛发再生)以及减少癌症治疗副作用(如口腔黏膜炎)提供了有力证据[13]。其细胞机制——线粒体细胞色素c氧化酶的激活——具有生物学合理性,并得到体外数据的支持。关于"皮肤年轻化"、镇痛和减重等更宽泛的市场宣称,证据则是混合到薄弱的;辐照度与波长差异极大,使得跨研究比较几乎不可能[13]。
这些"已证实"和"有力证据"层级实践所呈现的模式具有启发意义:没有任何一项以健康营销暗示的方式起作用。间歇性禁食并非代谢炼金术——它只是另一种形式的热量限制;桑拿并非排毒——它是反复的心血管应激;正念应用并不能带来深刻顿悟——它带来的是抑郁症状的适度但持久的改善;红光疗法并不能逆转衰老——它有狭窄而明确的皮肤科应用。科学支持的是具体的、适度的、基于机制的宣称;营销支持的则是更宏大、更耀眼的东西。两者之间的鸿沟,正是健康产业的商业空间。
冷水浸泡已成为2020年代标志性的健康实践——被运动员、播客主持人和风险投资者推广,浸泡桶售价在5000至15000美元之间。其证据基础真实但狭窄。迄今最严谨的整合是2024年Yankouskaya等发表于PLOS One的荟萃分析,涵盖11项研究、3177名参与者[2]。汇总结果显示:冷水浸泡(≤15°C,≥30秒,及胸)能在浸泡后12小时内带来可测量的压力下降、睡眠质量的适度改善以及自报病假天数的减少。但同一荟萃分析也表明:生活质量的改善在3个月时已不再具统计学显著性,且短期炎症标志物在浸泡后的即时阶段实际上升高[2]。
"冷水浸泡能'重置'神经系统、治疗抑郁、加速代谢恢复、提升免疫功能"等营销宣称,最多只能获得部分支持。在播客文化中流行的"多巴胺提高250%"说法,依据的是2000年针对10名男性志愿者在14°C水中浸泡1小时的单一研究——而几乎没有任何消费者级冷水浸泡能复现该方案[2]。运动恢复方面的文献则更具歧义:抗阻训练后冰浴似乎反而损害肌肉蛋白合成与肥大。低温暴露是真实的生理学;但所市场化的效果范围则不是。
呼吸训练——尤其是结合过度通气、屏气与低温暴露的Wim Hof Method(WHM)——已积累了真实但方法学上薄弱的文献。2024年发表的首部系统综述识别出9篇论文与8项独立试验,每项参与者15至48人,男性占86.4%[10]。结论是:WHM可能通过肾上腺素峰值降低炎症标志物,可能改善某些心理指标,且在健康成年人中没有明显的安全问题。综述者的整体评估是:"研究质量很低,所有结果都必须谨慎解读"[10] —— ⚖ 有争议。该实践并非毫无价值,但市场化宣称——WHM能治愈自身免疫病、抑郁或慢性病——大幅超出了证据所能支持的范围。
胶原蛋白补充剂在证据方面占据了特别富有启示的位置。2025年《American Journal of Medicine》一项荟萃分析汇总了23项随机对照试验,涉及1474名参与者,研究胶原蛋白对皮肤老化的作用。主要发现是:胶原蛋白补充剂相对安慰剂显著改善皮肤水合、弹性与皱纹[4]。限定性发现是:当按资助来源分层后,未由胶原蛋白制造商资助的试验在上述所有指标上均未显示显著效果。整体效果完全由产业资助试验所驱动[4]。这是健康文献中资助偏倚最清晰的演示之一——一个看似阳性的整体结果,完全有赖于带有利益冲突的研究。
当一组随机对照试验产生的阳性效果在排除产业资助研究后即消失,理性的解读是:效果很小或不存在,受资助文献则在高估它。胶原蛋白补充剂正符合这一画像。同样的模式还出现于:用于关节炎的氨基葡萄糖、用于健康成年人认知的omega-3,以及补充剂类别中位居"较强"端的若干适应原。
红外桑拿处于"有力证据"层级,但保留意见相当多。《Mayo Clinic Proceedings》的桑拿证据综述以传统芬兰桑拿数据为主,那里心血管死亡率获益是稳健的[11]。红外桑拿专属数据则要薄弱得多——试验更小、常由产业资助、对象多为心脏病人群、随访时间较短。两种模态间的外推具有中等合理性——两者都引发体温调节应激——但"红外桑拿能产生与芬兰桑拿同等心血管获益"这一假设并未得到确证。红外桑拿的营销还提出了"细胞排毒、减重、免疫增强"等任何模态下都缺乏证据基础的宣称。
益生菌补充剂——一个独立的、规模超过600亿美元的类别——产生条件性证据。特定菌株对特定病症显示出疗效:Lactobacillus rhamnosus GG用于抗生素相关性腹泻、特定双歧杆菌菌株用于肠易激综合征亚型、粪菌移植用于复发性艰难梭菌感染。2024年美国胃肠病协会(AGA)指南明确不建议在健康成年人中使用益生菌以促进一般健康。2018年《Cell》上的一项研究发现,三分之二的健康成年人是"抵抗者"——益生菌未在其肠道定植,亦未带来可测量的菌群或症状变化。"以通用益生菌增强肠道健康"的市场化概念并未得到证据支持;而有针对性的"菌株—病症"匹配则得到支持。
这一层级的整体模式是一致的:存在真实的生理效应;该效应比营销所暗示的更小、更窄、方法学上更不确定;产业资助会放大对效果的感知;长期持久性很少得到证明。"诚实"的消费者立场——即这些实践可能在某些使用者、某些病症上带来适度获益,并存在足以促使谨慎的证据质量隐忧——并不是营销所传达的立场。
蓝光过滤眼镜是Cochrane综述明确否定的最清晰例子。Singh等人2023年的Cochrane系统综述分析了17项随机对照试验,得出结论:蓝光过滤镜片相对标准镜片在眼疲劳、睡眠质量或黄斑保护方面"未产生具临床意义的差异"[3]。研究结论明确不支持向普通人群推广。然而蓝光过滤眼镜仍是一个数亿美元的市场类别,由主流眼镜零售商作为屏幕重度生活方式的"必需品"进行营销。其在市场上的存续是监管层面的,而非科学层面的:这些宣称在技术上属于"结构-功能"("过滤蓝光"),而非疾病治疗("预防眼疲劳")。
为健康人提供的静脉维生素疗法是第二个明显案例。没有任何随机对照试验支持在健康成年人中以静脉营养输液缓解宿醉、增强免疫、提升能量或抗衰老[5]。FDA未批准任何健康类静脉输液疗法。克利夫兰诊所、梅奥诊所与休斯顿卫理公会医院都曾公开声明,所谓的市场化益处并未得到支持,且风险包括感染、电解质紊乱、维生素中毒(尤其是脂溶性维生素),以及来自未受监管医美水疗中心的不当配制混合物[5]。FDA于2024年1月特别警示了输液诊所的非无菌配制与无执照施治问题。然而该类别仍在增长,美国健康类输液年收入超过20亿美元。
2018年9月,加州检察官以"未有依据的医疗宣称"向Goop处以14.5万美元罚款——其宣称玉石与玫瑰石英阴道蛋可平衡激素、调节月经周期、预防子宫脱垂、改善膀胱控制[15]。罚金仅为该产品收入的一小部分。Goop未承担任何责任。该产品线以修订后的营销措辞重新推出,并继续销售。该案件是健康产业中监管行动运作的标志性范例:迟到、轻微、且在商业上可被吸收。
果汁排毒与"detox"方案已被主要医学机构全面否定。美国国家补充与综合健康中心(NCCIH)指出,没有证据显示果汁清洁或排毒饮食能去除毒素、改善肝功能或带来持久健康获益。2025年西北大学的研究检验了三天果蔬汁饮食,发现仅三天内,口腔与肠道菌群即向促炎物种偏移,有益菌减少[9]。临床生物标志物未观察到任何可检测的改善。果汁清洁会在数日内对微生物生态造成可测量的损害;其所宣称的益处则在任何时间尺度上都不可检测。
"接地"(grounding/earthing)类别——皮肤直接接触地表,或与接地的导电垫接触——产生了一些数量有限的文献,报告对皮质醇、心率变异性、血液黏度与炎症的影响。该文献存在严重的方法学问题:样本量小(通常少于60名参与者)、常缺乏盲法,并且作者与资助方在与"接地"产品有商业利益的人物身上呈现引人注目的集中⚖ 有争议。其物理机制——皮肤接触能传递在生理学上具有意义的电子电荷——并非不可能,但缺乏独立确认。主要医学机构均未支持将"接地"用于任何病症。该类别仍是一个数亿美元规模的消费市场。
Cochrane审查了蓝光过滤眼镜,未发现获益。FDA对静脉输液发出警告。西北大学研究表明果汁清洁三天内即损害微生物组。加州因玉石阴道蛋的宣称对Goop处以罚款。然而,这些发现都未导致相应市场崩溃。销售健康产品的信息生态运作速度,比检验它们的证据生态更快——而监管生态运作速度则最慢。这一时滞,正是商业机会所在。
玉石阴道蛋一案值得作为结构性范例加以关注。加州检察官于2018年对Goop处以14.5万美元罚款——这一金额很可能低于该公司从相关产品中取得的年度收入[15]。和解协议中并未承担任何责任。该产品以修订后的营销措辞重新推出,并继续销售。据报道,消费者总赔付额低于20万美元,以退款形式发放。与Goop更广泛的业务相比——其已筹集逾2.5亿美元风险资本,并经营着一个媒体—商务帝国——监管行动充其量只是经营成本,而非震慑力。这是健康产业执法的常态结果。
用于FDA未批准适应证的高压氧治疗、对健康人群进行的全身核磁共振(美国放射学会因假阳性率高而明确反对)、不经处方销售的肽类注射,以及大多数"生物黑客"干预,均处于类似的证据位置:缺乏可重复、大样本、独立资助、具有临床意义的获益证据。它们都共享一种营销模板——为运动员、企业高管和媒体名人所采用——在实际科学文献之外运作的同时,发出"科学严肃性"的信号。
该层级的共同特征是:产品并不需要证据来销售,所需要的是叙事一致性、社会证据,以及一个并不能高效传播Cochrane综述的信息环境。健康产业建立了上述三者;证据环境则尚未形成有效回应。
资助偏倚问题
当产业资助研究被从证据基础中剔除时会发生什么
在整个健康文献中反复出现一种模式:阳性的整体荟萃分析效应在排除产业资助研究后会消失、减弱或反转。2025年关于胶原蛋白与皮肤老化的荟萃分析是最清晰的范例[4]。该模式还出现于正念应用、氨基葡萄糖、omega-3、若干适应原以及一些益生菌菌株。✓ 已证实 在任何有意义的层面上,健康产业的证据基础都并非独立于产业。
健康研究中的资助偏倚主要通过三种机制运作。第一是直接的资助偏倚:由产业资助的试验由其经费依赖于赞助方的研究者设计、执行与分析。这些研究系统性地呈现更大的效应量、更不严格的对照(往往是无活性安慰剂而非阳性对照),以及选择性的结局报告(发表表现良好的结局、忽略其余)。2025年关于胶原蛋白的荟萃分析以罕见的清晰度展示了这一点:在产业资助的试验中存在效应,而在独立试验中消失[4]。
第二个机制是发表偏倚。期刊更倾向于发表阳性结果,而非阴性发现。在健康文献中,由于试验赞助方往往就是制造商,阴性试验可能根本不会被投稿。这在已发表的证据基础中制造了不对称,系统性地高估了表观效应量。其标准救济——研究在开始前进行预注册,并强制公布结果——在健康类别中执行得很不均衡。许多补充剂试验根本未被注册。
第三个机制是产业对证据生态本身的控制。诸如Council for Responsible Nutrition等行业协会撰写综述论文、赞助科学会议、为临床医生资助教育材料。其最终产物并非总是错误,但会系统性地以有利的视角呈现健康产品。研究者其实验室运营依赖产业资助,因而面临维持友好关系的结构性压力。结果并非欺诈,而是文献重心朝着支持产业的结果缓慢漂移。
健康试验中的利益冲突模式并非健康类别独有——制药研究也存在类似问题——但健康类别拥有更弱的结构性对策。制药试验必须预注册、必须报告所有结局,并在批准前面对FDA对全部证据的审查;而补充剂试验不面对上述任何要求。监管严格性与商业体量之间的不对称,产生了独特的结果:一个6.8万亿美元的产业,其主要科学辩护建立在一份基本由其本身资助的文献之上。
| 风险 | 严重程度 | 评估 |
|---|---|---|
| 资助偏倚抬高效应量 | 已在胶原蛋白、正念应用、氨基葡萄糖、omega-3认知试验以及若干适应原中获得实证。2025年的胶原蛋白荟萃分析是最清晰的"自然实验"。 | |
| 发表偏倚/未注册试验 | 大多数补充剂试验未在ClinicalTrials.gov上预注册。阴性发现被严重低发。效应估计被系统性地向上偏移。 | |
| 掺入处方药 | FDA于2007–2016年间记录了776种掺假补充剂——包括西地那非、西布曲明与合成代谢类固醇。召回为自愿性。许多产品在监管警告之后仍留在货架上。 | |
| 健康输液/医美水疗中心污染 | FDA 2024年1月警示:非无菌配制、无执照施治者、消毒不充分的混合液。各州执照标准不一;联邦层面无监督。 | |
| 全身筛查的假阳性级联 | 美国放射学会明确反对在无症状个体中进行全身核磁共振。假阳性率高将导致不必要的活检、下游检查和患者伤害。 |
上述风险概览澄清了消费者的实际暴露:最受市场化的健康实践,在以常规剂量用于健康使用者时,不会带来具临床意义的伤害——风险主要是金钱与机会成本,而非医学层面。但例外不可忽视:掺假补充剂、来自未受监管诊所的输液混合物,以及导致级联伤害的筛查方案,构成真实的安全风险,而非纯粹的商业问题。健康产业的安全记录并非灾难性,但也并非营销所暗示的样子。
对资助偏倚证据的诚实解读是:已发表的健康文献系统性地比其背后的生物学现实更有利于健康产品。这种偏倚并不均匀——某些实践(桑拿、限时进食、光生物调节疗法的特定适应证)即便在严格的独立评估中也能立得住——但整体倾斜已被充分记录;将已发表文献当作中立指南来对待的消费者与临床医生,会被系统性误导。补救之道是结构性的,而非个人性的:独立的资助机制、强制预注册、整合的监管权力。这些在健康类别内均未形成规模。
信息生态
为什么证据没能抵达消费者
2024年关于TikTok健康与wellness内容的一项研究显示,在所分析的内容中,32%由非专业网红制作,注册营养师仅占5%。在网红内容中,减重内容占营养类内容的34%,且其完全不准确率达28%。该平台的推荐算法优先分发高互动内容,而高互动内容系统性偏离循证建议。这并非"信息失败",而是"信息设计"。
当前的健康信息生态在结构上已偏离证据。三种力量造成这一结果。第一是平台的激励结构:社交媒体奖励能产生使用时长的内容,而非准确的内容。一段承诺"三种成分治炎症"的TikTok短视频,会跑赢一段解释同一干预的Cochrane综述。算法分发放大了这种差距;随着时间推移,网红生态系统会筛选出能够创造最高互动度的人格与形式,而互动度与认识论的严谨性呈负相关。
第二种力量是健康类网红的财务激励结构。TikTok的"创作者奖励"项目、Instagram的联盟营销基础设施,以及更广泛的网红经济,都将"触达"商品化。健康类网红通过指向补充剂品牌的联盟链接、赞助贴文、品牌商品、付费课程以及直接面向消费者的产品发布来变现。这种经济依赖产生了倾向于"愿意支付佣金"产品的结构性偏好——而这些产品又恰恰是营销预算最大、证据基础最薄弱的产品。
"TikTok由非专业内容创作者主导,健康与wellness网红占样本的32%。相比之下,注册营养师仅占所分析内容的5%,但生产了最准确的内容,其中42%完全准确。减重内容则呈现出最高的'完全不准确'比例,达28%。"
——#WhatIEatinaDay:TikTok营养内容的质量、准确性与互动度,2024综述第三种力量是准确内容与误导性内容之间的生产成本不对称。制作一段30秒、能正确总结一项Cochrane综述的视频,需要阅读综述、理解方法、并将临床统计翻译为可理解的语言;制作一段30秒、声称某种补充剂可逆转某种病症的视频,则什么都不需要。误导性内容的内容成本要低一个数量级,而平台对两者的奖励却相近。其均衡是可预见的。
循证信息路径
Cochrane综述、Lancet伞状综述、JAMA系统综合;预注册试验并强制公开结局。
多年方法学训练;熟悉统计学保留与临床试验的局限性;不存在商业依赖。
"效应量为小到中等;证据基础存在产业资助方面的隐忧;结果可能无法外推到该试验人群之外。"
互动指标更低、病毒传播较弱、移动端阅读体验较差;在注意力市场上输给"快、确定"的内容。
能触及主动寻找信息的人、医疗从业者与政策语境;很少在消费者购买点位触及到他们。
健康类网红的信息路径
个人证言、播客剧集、品牌资助的"研究";很少准确引用一手文献。
常无正式资质;商业上依赖补充剂、设备或服务类别;筛选能驱动销售的内容。
"这套方案改变了我的生活——以下是四个步骤。"确定性是互动度的货币;细微差别则在互动度上是负值。
完成率、评论与分享率高;进入"For You"推送;在用户脆弱或抱负时刻送达。
头部健康网红每月可触及数千万人;内容恰好在购买决策点送达,常带有联盟链接的转化路径。
上述对比并非"好人vs坏人"的描述,而是对一种结构性信息不对称的描述。即便是出于善意的健康类网红,也在一种倾向于淘汰审慎宣称的激励结构中运作;即便是严谨的临床研究者,也面临使其结论无法到达消费者的分发劣势。不对称是架构本身,而非身处其中的人格。
健康生态尤其擅长将医学权威转换为商业信号。网红会引用同行评议研究——通常只是摘要,常常未阅读方法或局限性部分——仿佛"被引用"本身就足以确立其底层主张。研究是真实的;引用在技术上是准确的;其暗示却是误导性的。2024年华盛顿大学关于错误信息的研究发现,这种模式在高互动度的健康内容中具有典型性:真实引文、被扭曲的总结、超出研究所示的结论。
反向策略正在出现,但面临结构性劣势。隶属医疗系统的内容创作者(克利夫兰诊所在TikTok、梅奥诊所在社交媒体上的存在)、拥有病毒级粉丝的学术传播者,以及致力于反医疗错误信息的账户,已经构建了规模有限的"反向公众"。它们承受着与底层证据相同的算法劣势。在没有平台层面变革的情况下——平台已表明对此态度消极——信息不对称将持续存在。2026年欧盟《数字服务法》和英国《在线安全法》对最大平台施加了一定的杠杆,但在这些制度下,对健康错误信息的执法仍处于早期阶段。
诚实的总结是:消费者无法通过常规信息渠道便捷地获得循证的健康信息。他们可以通过其全科医生、公共卫生资源(NCCIH、NHS、Cochrane Library、NIH Office of Dietary Supplements)以及少数严谨的科学传播账号获得这类信息。消费者环境的信息设计并不向他们传递这一材料。健康产业的商业力量正是建立在这一缺口之上。
第一个结论是分类学上的。本报告所考察的十三种实践可以划入三组,而这种归类对个人决策至关重要。✓ 已证实 等级的实践——运动、地中海饮食模式、传统芬兰桑拿(高频率)、用于体重管理的限时进食、用于抑郁症的经过试验检验的正念应用、用于特定皮肤科适应证的光生物调节疗法——会带来真实、可重复且具临床意义的效应。这些实践的营销通常会高估效应量级,但其底层生物学是有支持的。对于希望在明确定义的结局上获得适度改善的个人而言,它们是合理的选择。
"有力证据但被高估"层级的实践——用于减压的冷水浸泡、用于减炎的呼吸训练、用于压力管理的南非醉茄与红景天、用于心血管健康的红外桑拿、用于特定病症的某些益生菌菌株、在产业资助试验中用于皮肤的胶原蛋白——会带来真实但小于市场化所声称的效应,通常伴随利益冲突的隐忧。它们对那些清楚效应量级、并且不愿在没有确认的前提下投入大量资源的个人来说,是合理的尝试。诚实的表述是:"这可能在这些特定结局上、在一段时间内带来一点帮助。"
"无证据"层级的实践——用于眼疲劳或睡眠的蓝光过滤眼镜、用于健康人的静脉维生素疗法、果汁清洁、玉石阴道蛋、用于医学病症的"接地"、用于FDA未批准适应证的高压氧治疗、对无症状人群进行的全身核磁共振——要么已按高方法学标准被检验为不具临床意义的效应,要么从未被检验且缺乏可信机制[3][5][9][15]。诚实的表述是:"证据并不支持这一宣称。"这些产品仍在销售,是关于监管与信息架构的事实,而非关于其有效性的事实。
健康产业的商业优势并非虚假,而是在同一种营销语域之下,对三种不同证据层级——已被证明、模糊、缺席——进行系统性的模糊化。消费者无法轻易区分;监管机构只处理最显眼的案例;信息生态分发"高确信度"的宣称的速度,超过分发"细致的证据"的速度。其结果不是消费者的错误,而是架构上的设计——一个6.8万亿美元的产业,其主要产品就是这种"模糊化"本身。
第二个结论是结构性的。健康产业并不是一个商业上的"可选项"。它现在占全球GDP的6.1%,雇用数以百万计的就业者,支撑着风险投资管道,并塑造着大多数消费者形成健康观念的信息环境。改革不仅是消费者教育的事——尽管这有所助益——也不仅是更激进监管行动的事——尽管这同样有所助益。它需要在证据架构(强制对补充剂试验进行预注册、独立资助机制、强制公开结局)、信息生态(针对健康错误信息的算法问责、强制披露商业关系)与监管边界(关闭"结构-功能"漏洞、对健康类服务建立联邦层面执照制度)等多方面同时变革。在主要市场上,这些变革的任何一项都未在近期政治议程中。
第三个结论是个人层面的。对于试图在健康市场中前行的消费者而言,证据支持一条具体的决策法则:对拥有稳健的、独立证据的干预(运动、睡眠、饮食质量、疫苗接种、循证的心理健康服务)赋予较高的先验权重;对证据基础较小或为产业资助的干预赋予较低权重;对已被正式检验且不达标的干预,赋予最低权重。这一决策法则并不新——它就是循证医学的标准方式。新的是这种系统性掩盖其应用的营销环境。
第四个结论涉及医务从业者的角色。全科医生、注册营养师与临床心理学家有条件作为消费者与证据基础之间的接口——但前提是他们自己有相应的资源。全科诊疗的时间压力、关于补充剂与健康类实践的继续教育课程的缺口,以及来自健康生态的患者期望的持续上升,共同构成了一种临床环境:从业者在质询健康宣称时,其装备往往不如患者。对临床医生资源(可获取的证据综述、常见健康类咨询的决策辅助、问诊中处理这些问题的时间)的投入,将显著改善消费者保护——但这并未在规模上实现。
第五个结论涉及概念框架。健康并非医学的对立面。两者共享创始人、期刊、会议和学术职位。两者之间的边界是监管与商业意义上的,而非生物学意义上的。同一种干预——例如限时进食——在一个语境下表现为循证医学,在另一个语境下又表现为市场化的健康产品。这条边界的瓦解在某种意义上是建设性的:许多循证实践曾被主流医学忽视数十年,先在健康传统中被保留,再回到医学文献。其代价是证据纪律的丧失。该产业尚未生产出来的"综合"是这样一种综合:在保留两种语域各自不同的证据承诺的前提下使二者并存。
健康产业之所以存在,是因为需求存在。人们感到不适、焦虑、疲惫或衰老,并愿意花钱去应对这些状态。医学在历史上对这些需求的供给不足——过于以疾病为中心、过于以急性医疗为导向、时间压力过大。健康产业填补了这一空白。问题不在于该产业是否应当存在,而在于它应被置于何种证据纪律之下。本报告中的证据表明,目前的答案——比制药医学宽松得多——产生了一个市场:相当一部分产品并不起作用,而消费者无法轻易辨认出哪些是哪些。这是一个可解决的问题;它尚未被解决。
归根结底,证据告诉我们:消费者需要更好的信息架构,临床医生需要更好的资源,监管者需要更大的权限,产业需要更好的激励。这些目标无一不可达成;当前却无一在路上。在它们成为现实之前,上述记分卡仍是一个普通消费者带入健康市场最有用的工具:一份按证据级别分级的地图,标明什么有效、什么可能有效,以及什么几乎可以确定无效。