区块链如何重塑基因测序行业?
基因测序行业在近二十年的时间里,发生了巨大的变化,其中一个最让人吃惊的变化是它的测序成本大幅下降。2001年,人类基因组完成测序,耗资高达30亿美元,而现在成本降至1000美元,随着时间的推移,甚至有可能降低到100美元以下。
如此幅度的成本下降,意味着大规模人群采用的条件已经初步具备。那问题来了,就算是价格普通人可以负担,但对于人们来说,为什么要去做基因测序?目前看有几个好处:一是便于更好做疾病诊断;二是做疾病的提前预防,通过基因测序发现患某些病的概率较高,可以提前采取措施。如好莱坞明星安吉丽娜·朱莉进行基因测序之后,发现自己有易患乳腺癌的基因,因此采取措施提前切掉乳腺。(当然,从科学角度,这并不是说一定需要采取这样的措施,或者采取这样的措施之后就一定能解决问题,仅目前来说,这里提供了一个可供选择的预防方案。);三是有助于创建个性化治疗方案。
这是从普通个人来说的直接好处,从行业发展的角度,或者从整体人类利益的角度,如果通过某种方式,能实现把基因组数据共享给研究者,这对研究人员找出规律,提供个性化保健方案、治疗方案或研发新药等都有帮助 。
如果实现了基因组数据共享,这里有机会诞生一个数十亿美金以上的基因组数据市场。不管是基因组数据的所有者、还是基因组数据的需求方,都会从中获益。
那么,如何来创建基因测序的交易市场?它需要解决哪些问题才有机会真正创建?这就是本文试图阐述的地方。
首先是要继续推动基因测序成本的显著降低,唯有如此,才能让更多普通老百姓参与进来,参与的人越多,意味着基因组的数据越多。
其次,大多数人对新事物,尤其是基因测序这样涉及个人隐私和安全的事情会比较在意,也会有疑虑,如果不能解决普通人的担忧,那么,即使价格便宜,也会遇到走向主流人群采用的障碍,所以,区块链+基因测序会优先考虑提高基因组数据的安全和保护。
最后,这个行业存在着基因组数据的明显需求者。但是,目前这些需求者能够得到的基因组数据少之又少;也希望让基因组数据的买家能够更有效率获取更多的数据。
基于以上明晰的思路,试图通过区块链技术来解决问题,以一种去中心化、加密的方式来达成目标。
基因组大数据还不是真正的大数据,很难用作机器学习,也不利于后续的研究发展。据估计,目前人类完成基因测序的人口才100万人,0.02%的人口都不到。即便如此,由于单个人的基因测序通常会产生很大的数据量,大约能达到200千兆字节,必须使用计算密集型计算处理。这意味着如果未来有上亿人口进行基因测序的话,会面临很大的挑战。一是需要大量的存储空间来存储基因组的数据。二是网络传输的速度也会对数据共享造成困难。三是基因组大数据的处理和分析需要大量的算力支持。
传统的基因测序模式很难建立起真正的基因组数据交易市场。因为它很难解决基因组数据归用户所有的问题,无法调用用户参与积极性,在获取大规模数据方面存在天然的障碍。
而利用区块链的去中心化模式,则带来改变。它首先把基因组数据的所有权归还给个体。其次,它构建了能够保护用户数据的安全计算。再次,它充分利用智能合约、区块链技术以及代币体系。
这样的结果是可以实现基因组数据的买家和卖家直接交易,跟传统的模式不同,数据的买家和卖家之间的交易降低了成本。成本的降低导致基因组测序服务价格更加便宜,推动更多人参与进来。更多人参与进来,导致数据价值的提升,数据价值的提升能够让基因测序服务本身更有指导意义,包括对医疗、生育、减肥、保健等方面都重要的影响。
尤其是一旦实现了基因组测序数据、相应的表型数据与机器学习的结合,可能会给人类带来很多意想不到的新发现,可以为每个人提供个性化的健康指导。这对于大多数人来说,都具有足够的吸引力。
此外,通过去中心化的模式也解决了人们对隐私保护的担忧。为了让人们不用担心,基因组数据拥有者可以私下存储自己的基因组数据,同时控制访问权限。数据共享时,也会采用加密安全计算等技术。与此同时,数据的拥有者会保持匿名,数据买家则要求是身份完全透明。区块链存储所有的交易记录,这些交易记录都不可篡改。
对于数据的需求方来说,通过从个体用户直接获取高质量的基因组数据和相应的表型数据,可以降低成本,更方便从数据中找出规律,便于研发新药,便于为用户提供个性化的健康方案。
鉴于基因组测序目前的价格还不便宜,还有普通用户在区块链技术及相关技术的使用上还存在一定的易用性障碍,要形成真正的基因组测序交易市场还有很长的路要走。对此,我们要保持清醒的认识,同时也有充分的耐心。
从以上的阐述可以看到,区块链技术和去中心化的模式能够对基因组测序行业产生重塑的作用,期待像基因测序这样的项目能够充分利用区块链,创建出真正的有规模效应的去中心化的基因组数据交易市场。一旦走向正向循环,这会产生前所未有的行业效应。