何谓大数据?顾名思义,就是体量特别大且数据类型复杂多样的数据集,其特征是数量大、类别多、真实性高、速度快,因而难以用传统数据库工具对其内容进行抓取、管理和处理。如今,随着现代科技的发展,人们对数据处理的能力也在明显提高,以往一团迷雾一样的大数据成为新的科研富矿,从中人们可以科学地存储、研发、利用、分析数据,并得到精确的结果。
从垂体瘤研究看大数据
北京市神经外科研究所 张亚卓
大数据让科研更具针对性
我们正处在一个医学信息爆炸的时代。据统计,医学信息资源占据约30%以上互联网信息资源,医学文献的数量正以惊人的速度增长。全球医药类期刊近3万种,每年发表论文200多万篇并且以每年7%速度递增。临床医生平均每天必须阅读大量的专业文献,才可能跟上现代医学发展的速度。2012年,美国政府发布了《大数据研究和发展倡议》,旨在利用大量复杂数据集合获取知识和提升洞见能力,投入金额高达2亿美元。与此同时,医学科技的发展也离不开大数据。在科研的过程中,大数据的利用、开发和整理,可以颠覆我们以往很多研究结果,为我们带来意想不到的效益。
大数据时代下的医学科研,应该具有三个主要特点。第一,临床医学资源发掘、收集、整理和利用(标准化、科学化)。第二,大样本、多中心的临床研究(病因、诊断、治疗及药物开发)。第三,依托临床信息的生物医学资源的整理、利用及研究(基因、蛋白及代谢)。那么,大数据时代下的肿瘤研究的特征就更具针对性了。主要有临床信息、肿瘤生物学特性、基因蛋白等数据库,个体基因测序和数据快速处理,分子标记、药物靶标的鉴定和特征描述,新型药物的设计。
可指导垂体瘤个性化治疗
以垂体腺瘤为例,其最大的特点就是它的生物学多样性,造成在亚型分类上识别困难,少数侵袭性腺瘤治疗困难,药物治疗很多不耐受,放疗疗效不均。而常规病理分类不能准确指导临床治疗,主要表现在同一病理类型的肿瘤对药物治疗和放疗的反应不同,因此易导致治疗过度与治疗错误并存。
大数据时代下,可以用分子病理来指导垂体腺瘤个性化治疗。但应建立科学标准的病例资源库以及临床信息和疾病生物医学特征信息收集、分析、整合、开发及利用,从而研究肿瘤发生发展变化,认识疾病本质,寻找治疗规律。大数据可以推动垂体瘤的个性化研究。侵袭、耐药是垂体腺瘤基础研究的热点,也是目前垂体腺瘤临床工作中急需解决的难题,侵袭、耐药行为的识别至今仍然缺乏客观标准。
用好海量数据提升治愈率
为充分利用现有的海量数据,这几年我们团队着力做了四个方面的工作。第一,前瞻性、多中心、大规模临床信息的发掘、整合、分析应用,用研究的成果不断修改和完善已有的指南共识等。第二,脑肿瘤分子分类与个性化治疗的基础临床研究。第三,现代微侵袭神经外科的研发、应用和推广。第四,围手术期脑与神经功能状态评估、预警和保护。这四项研究为垂体瘤的个性化治疗提供了理论、方法和技术支撑。
由于垂体瘤具有生物多样性,未来我们还需要积累更可靠的临床资料、肿瘤样本和多层次的生物学信息,并对海量的信息和数据进行深入的采集、分析和利用。为此,我们建立了“垂体瘤分子分类和个性化治疗研究合作平台”,联合10~200家医院,参与多中心研究的网络中心化管理,构建专用软件进行数据挖掘与整理。同时依托北京市神经外科研究所和北京天坛医院的分子病理诊断与个性化治疗指导中心,进行病例资源收集整理、临床评估诊疗随访、病理诊断分类、 提供治疗指导等,采取共同承担国家项目、技术合作等多种合作方式,实现互惠共赢。