专注于分享
分享好资源

数字安全技术赋能生物大数据互联互通

科普时报记者 陈杰

近年来,生物安全在全球广受重视,重大传染病防控则一直是生物安全管理中的重中之重。由于生物安全数据管理的要求,生物大数据大都分散在各个部门,难以实现互联互通。为了建立面向生物大数据应用的互联互通合作协调机制,提高符合国家数据安全保护要求下的数据开放共享水平,更好地为国家生物安全体系建设提供支撑,在日前由中国科学院微生物研究所、中国科学院计算机网络信息中心、中国生物工程学会、绿盟科技等单位联合主办的“生物领域数据安全管理与跨领域互联互通实践研讨会”上,国内首个国家微生物科学数据隐私计算平台一经发布,就成为各界关注的焦点。

生物大数据是指由生物实验产生的大量数据,包括基因组学、转录组学、蛋白质组学、代谢组学等各个层面的数据。这些数据通常需要高度整合和分析,以获取生物体内的关键信息和理解生命系统的复杂性。生物大数据的采集、存储、共享和使用涉及生物科技、信息安全、隐私保护、法律法规等多个领域,更是需要通过合理的技术和制度设计来保障生物数据的安全和流通。

绿盟科技CTO叶晓虎博士接受记者采访时表示,生物科研领域的研究对象往往是生命体,会涉及很多敏感信息和隐私问题,需要采取严格的数据安全和隐私保护措施;生物大数据来源广泛,需要统一的数据格式和标准,以便不同实验室之间的数据共享和比较,数据的共享更需要考虑到数据隐私和保护问题。“生物科研领域在数字化进程中,需要格外加强数字化技术的应用和数据管理规范化,同时加强对生物大数据安全和隐私保护的管理,才能促进生物科研领域的数字化转型和可持续发展。”

据了解,国家微生物科学数据隐私计算平台主要面向重要高致病性病原菌及流感等病毒数据,针对其在安全保护条件下进行分析和共享的需求,使用基于国产可信硬件的隐私计算方案,保障经加密后的基因序列在加密态的内存中进行序列分析。当分析完成后,相关密态数据会被立刻彻底销毁。

叶晓虎表示,通过前沿密码学、隐私计算、区块链等数据安全技术,平台能保障包括计算分析服务提供方在内的各方,对数据可用不可见。“平台中进行互联互通的相关数据受到符合国家密码标准的数字签名技术保护,使用区块链技术完成全流程监控,通过哈希、签名等密码学技术对关键流程进行了各方不可否认的存证,并提供科学数据链颁发的全网唯一的区块链证书以确保数据权益。”

参与研讨会的专家均认为,科学数据的重要价值在于数据的流通和再利用,利用先进区块链和隐私计算等先进的数据安全保护技术,在保障数据安全、合规合法的前提下,充分实现科学数据要素价值,具有重要的意义。国家微生物科学数据隐私计算平台利用区块链和隐私计算的技术保障了数据的安全可信流转,助力了科学数据更好地支撑国家重大传染病防控,是国家生物安全大数据体系建设的重要环节。

从技术角度来看,生物安全大数据互联互通的合作机制的核心在于可用不可见、隐私计算和区块链等技术。

叶晓虎认为,传统“复制式”的数据流通方式会让生物数据产生泄漏,因此无法满足合规需求。此外,生物数据存放在多地、多机构,机构共享数据会产生合规风险,因此产生了“数据孤岛”。“以联邦学习、安全多方计算、可信执行环境为代表的隐私计算,通过在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算,可以保障数据以‘可用不可见’的方式进行安全互联互通。在生物安全领域引入隐私计算等技术,有助于在多个方面助力生物安全的落地。”

目前,我国医疗数据呈现出数量大、缺乏统一标准、质量参差不齐、数据分散等特点。叶晓虎建议,隐私计算技术与区块链技术的融合,可以为医疗数据提供一套完整的分布式存储和安全共享的解决方案,将“数据孤岛”改造为“数据金矿”,使得医疗数据产生更大社会效益、服务国计民生。