基因专场讨论
最后更新于:2022-04-01 03:40:39
>[info] 主题:阿里云助力基因行业创新
> 时间:2015年10月14日
> 地点:采访间5(14—15)
> 速记:陈静
主持人:欢迎各位来到云栖大会基因采访间,今天请到行业内的几家公司,华大基因—官鑫 聚道科技—李夏戎 一脉基因—郝向稳,以及各位媒体朋友的到来,非常感谢。接下去从官鑫开始每个人介绍一下自己和公司,以及行业从事的方向。
官鑫:我先介绍一下华大基因,可能媒体应该知道。华大跟阿里有很大的渊源,华大基因比阿里早成立一天。华大现在是全球最大的基因研究中心,覆盖科技服务、医学研究、农业各方面的领域。我个人是在负责华大互联网,我们有一个互联网发展中心,作为互联网的战略发展,同时我们有一块牌子是互联网信息服务子公司在运作华大基因越来越多的成果面向C端的事情。包括整个IT部分,都在互联网公司运作。我是在这个部分做运行。
郝向稳:我是一脉基因的郝向稳。说起一脉基因大家比较陌生,2003年我是在华大基因,当时华大基因在北京,去年我从北京公司离职创办了一脉基因,我们的定位主要是做人的基因组数据的分析、存储、解读,还有健康产品的开发。华大基因是全球最大的测序企业机构,他们动物也做、人也做、健康也做,包括医学,各种各样的都有,我们只做了一个基因组的DNA面向健康方面的研究。因为我们在做这个事情的过程当中,一开始我们没有对云是没有认识的,后来因为我装修了一个房间,准备买服务器,后来发现是不小的投资,而且折旧很快,后来就了解了云以后,转到云计算。
李夏戎:我是聚道科技的李夏戎。我们的网站叫聚道,我们是面向基因领域提供一套云计算方案,包括传输、存储、计算以及后续的分析。我之前本人是在阿里巴巴,去年下半年出来创办新的一家公司。我们团队的创始人、技术的骨干都是有阿里的背景。我们面向解决的是说我们基因体系这么大体量的数据,像郝总他们做的一个基因组是一百GB的数据,这么大的数据怎么传输、存储,更快的、更短的时间分析它,我们主要在这方面做一些工作。
提问:我想问一下咱们用大数据去结合基因,简单介绍一下未来的场景,会给我们带来什么新的变化?跟普通老百姓生活有什么密切关系?
官鑫:首先本来基因就是一个大众的事情,因为它需要很大的量才能解决问题、得出结果。其实我们华大前CEO有专门回答这个问题,当大数据和人工智能用到基因行业的时候,会让基因行业从传统的实验科学走上一个快速突破的时候。现在对基因来说,我认为是揭开了一点点的面纱。当然现在的发展比当年快很多,但其实还是需要更大量的突破。现在我们对于很多复杂疾病的了解,包括人的表情与基因数据的关系,都需要很多的样板量去做验证,甚至需要机器学习完成。如果有这样的大数据技术和云计算,包括人工智能介入,在很多行业可以去做出很多成果和开发出很多产品。其实现在在类似于小米这样的模型上面,已经建立了算是比较靠谱的人工智能的模型,在植物方面,这个东西不能再人方面做。我们可以发现当你把基因当做程序信息的时候,你在研究改变它、刺激它外界的信息你都能搞清楚的时候,你几乎可以预测它的大小、产量、质量,如果这套东西用到人身上,那是非常不可想像的事情。
提问:可以提到对人种的改变。
官鑫:真的是解决生命降临的动作,是需要人工和大数据的介入。
李夏戎:结合我们几个客户的例子,我们有一个客户是中国基因应用控制中心,他们的作用是什么?他们在全国搜集各种各样的传染病原的数据,判断这个传染病原由哪种治病因引起的,比如埃波拉或者更早的SAAS、甲流、禽流感,这样他们需要有分布式的处理能力,一旦在一个地区发现传染人群,通过检验、基因测序知道它的微生物体系。我们相当于帮他们建立这样的一个云端服务,让他们能够在杭州市某个地区发现的就能够快速的解读这些微生物它的基因组的信息,属于哪个种属,这样就可以知道是已知的还是未知的,才后采取对应的方案,投放什么控制的措施,这是跟普通人的关系。当然华大也说了,在农业上做了一些数据的发布,相对来说帮助我们去缩短水稻育种的过程,这样会增加中国的种业水平在国际上的水平,这也是一方面。另外还有有点类似于个人健康问题,包括遗传病,怎么样去分析基因遗传性,这样其实能够帮助我们家族性的病史的,我怎么通过基因数据的分析,我们知道我未来的后代有多大概率得这个疾病,以及怎么去预防这个疾病的发生,这些都是跟普通的人都能够产生关系的。
郝向稳:其实大数据这个概念是在这两三年特别火,报纸上、互联网上很多,真正来讲要是了解像大数据的本质,在基因这个行业,十年前就开始搜集大批量的人群的数据,来找基因跟疾病的关系,找到这个关系以后我就知道某一种病跟某种基因有关系,我去诊断疾病会有一个诊断的准确性大大提高。另外人的健康和疾病的数据都能够纳入,基因的数据是一方面,还有心率、血压、血糖,甚至医学项目的数据,这些数据综合起来才能形成一个人的完整的特征,把这些数据全部综合起来,才能正确的评判了解他的健康状况。某个基因数据在他治疗的时候可以用到最准确的药物。人有两万多个基因,可以一步一步通过数据分析的方法找到它的功能。
提问2:我是中国科技报的记者,华大基因跟科学院关系很密切,我就先提一下北京还是广州,广州查获了一个人带了很多人体基因的东西,这个被海关隔离的,你外国的东西要进行报批的,没有手续什么的,当然他提到是某机构检测的。想问一下现在的政策基因,基因行业是热门行业,国家的态度也是很明确的,国外的基因能否带进来,以及检测的对伦理和隐私都有考量,想谈一下目前行业存在哪些比较严重的制约,希望哪些方面能够松一下能够促进行业的发展。另外现在有些小公司,价格收费都是比较高的,市场火了,很多人都来了,怎么看待价格跟提供服务的差异性?以及怎么对服务的价格有些规划?
官鑫:先回答这个新闻,不太确定是哪家基因公司的,但我相信对于样本带入国内肯定不是基因公司的问题,像一个水果也不能从香港带过来,所以跟国家鼓不鼓励基因政策关系不大。第二华大所有的国际业务都是在香港做的,香港有全中国最大的测序机器,所以我相信应该不需要,我们所有国际上的检测都在香港完成,这是第一个问题。
第二个关于政策方面的问题,国家对于基因行业的政策,所有基因行业的人都有很多理解,有鼓励的时候,也有需要按照规则做的时候。反正我觉得挺好的一个事情是至少CFDA是在全世界第一个FDA级别给华大发了第一个基因临床医疗的资质,这是领先于美国的。当然之前我们做了很多的努力,有一本《基因决战》的书提到:基因行业不能像其它行业落后美国几十年的发展,这样是能够促进中国在这个行业不要像航天其它行业一样落后别人的。这样一个过程,对中国基因的从业者还是很苦逼的事情,去年年初给华大发了肿瘤方面的资质,这个方面还是支持的。
第三个问题,基因公司越来越多的出现,基因行业只是开了一点头,华大基因经常说我们是基因人才市场,市场上有一半的公司是华大的人出去做的,我听到的我的老板也是这样认为的,这个行业需要很多人去做。包括华大很多成果也是站在当时的欧美科学家,很多科学人员的成果。这个行业需要更多人投入。
提问:国家发了一些证书、支持,我个人的感觉总体来说涉及到人类的本质,这几年应该来说还有一个比较鲜明的特征。
官鑫:补充一个问题,杨主席是我们的创始人之一,同时是中国包括美国奥巴马、非洲三个地方的联合国轮值主席,所以我相信整个全社会的基因机构都会在农业方面做一定的规则。
提问:国家大势是鼓励行业的发展,我没有理解错的话,基因测序更多的还是去一些比较有钱的人,或者比较有想法的人,查查自己有没有可能得什么疾病,可能门槛还是相对比较高的,不是一般的民众可以享受的。咱们作为从业者,需要哪些鼓励,或者政策的支持,或者松绑之类的?
郝向稳:这个问题比较大,我随意发挥。第一个就说您提到说几百块钱的,可能有几千块钱的、几万块钱的,刚才我提到人的基因有两万多个,两万多个基因影响人的健康的方方面面,有的人关心心脑血管疾病,有的人关心减肥是否有效,每个人关注不一样,基因检测是宽泛的概念,市场上有针对各种各样不同目的的基因检测的套餐。这种套餐价格是不一样的,内容也是不一样的,采用的技术、芯片,做基因测序、全基因组测序,包括其它的技术,技术是不一样的,这点导致市场上价格不一样,看着很混乱,加上任何行业都存在良莠不齐的状况。我们也愿意行业非常规范健康的发展,其实在健康方面的话,在临床上相对监管比较严格,在大众的市场上,其实会涉及到各种各样对基因的解读不一样,这又会涉及到解读基因信息的数据来自于什么样的数据库,来自于中国还是外国的?针对什么样的人群?白人还是黑人还是黄种人,因为不同的人群基因的形态不太一样,解读也会有一些差异,这样会导致市场上即使是黄种人类型的基因检测的结果判断也不太一样。这个情况不是中国的,美国的卫生科学院院长找了美国的三家公司测了以后也差异很大,用的数据库也不太一样。针对中国政府如果鼓励的话,在科研数据的搜集上,数据库的规范上,基因解读的规范上要做规范性的工作,会更好的利于基因行业的发展。
李夏戎:我们主要是做基因数据的数据处理的基础设施这一层,其实我们在做的过程中间,其实有一个比较大的,我们觉得政府应该能做的事情,就是数据安全性的标准问题。这个在美国做的比较好,美国无论医疗数据还是个人有关的数据都有一系列的标准保证它如何去存储、传输,以后处理怎么保证个人的隐私方面,中国这一块是一个模糊的概念,会导致很多的企业,一个问题是说很多企业,比如说它想开展,很多单位、包括研究机构、医疗机构想去做,利用这些数据的时候,发现他们没有统一的规则,很多人可能会选择我不做这个事情了。
另外一方面可能会导致,刚刚郝总说的行业上有些人觉得这样没有规则,可能会产生一些比较乱的事情,数据可能随意的存、处理,这样的话意味着按规矩的公司成本比较高,如果你不去坚持一定的标准,坚持你的要求,可能成本比较低,这样反倒会成为良弊跟劣弊的关系,出现劣弊驱逐良弊的关系,相信华大也会遇到类似的问题。国家怎么制订这样的一套标准,数据层面怎么保证安全的情况下尽可能的让大家共享知识,能够促进大家的沟通,这个事情是能够让这个行业发展的更快。
主持人:我也补充一下,很多行业一般监管的能力和速度要稍微滞后产业发展,针对新兴行业来讲。国家相关部门也需要时间了解市场的成熟度,知道到底发生什么事情,总结归纳出来以后制订有效的方法。样本太少的话,跟基因测序一样,没法做非常迎合市场或者培育市场的政策,这个需要一段时间。但是我非常同意官鑫讲的,这个行业本身是朝阳时期,中国有一个先天优势,我们的人口多,我们的测序样本非常多,这是全世界独一无二的,因为这个原因我们有各种各样的公司出来,这是非常好的事情,产业转生态,参与的人越来越多,起的会更快,这是我非常有信心的。
提问:我想问的一个问题在座各位有在基因行业做了很多的公司,也有像去年成立的新的创业公司,你们的创新力体现在什么地方?
官鑫:华大的创新来讲,是我们最重要的,每次会议都会提。本身基因是一个新的事情,所以创新会在几个层面:第一个技术层面,用更多的样本做出更多的结果,同时在产业链条里面,我们能够让测序活跃化,这也是非常重要的事情。华大的整体战略,我们经常在公司提叫做:大平台、全覆盖,最后在很多地方,产业链的各个链条做一些事情;另外在人的培养上更加能够体现,我们的人员的年轻程度非常精良,有很多十几岁的科学家出来跟几十岁的科学家对话,这个是比较明显的创新的体现。包括我们在现在的商业模式上也有创新,比如现在的事情就是一个创新的事情,两年前一次会议上我们提到说这样一个互联网时代来临,我记得老板他们是在一次跟国外公司谈话的会场,聊到说有一个脸书的公司做的东西,用脸连接人,是一个很好的,用基因连接人是更应该做的事情,所以有了我现在这个公司。在互联网的创新和O2O的引进都是我们非常致力于做的事情。现在我们是整个行业唯一一个能够在重的基因检测方面能够收买几千例的,把医疗机构跟基因公司、互联网公司连在一起做的,至少在我所做的这个事情里面最容易体现到的。所以我想谈技术上的创新不用提,在大数据层面甚至在商业模式上都在做创新。
郝向稳:说创新我们谈不上太大的创新,来自于我们对市场的了解,我们觉得市场上应该有什么样的想法需求,把这个需求去实现了。像中国投资机构投创业企业的时候喜欢到美国找对标企业,觉得这样成功率很高。当时我们融资的时候也说我们的对标企业是哪些?当时还没有。我们当时谈了我们的想法来做这个事情,后来前一段时间,之前的东家跟好几个公司合作成立一个公司,我发现这个公司的模式和我们很像,他们想做一些基于人的基因应用,对标企业也有了,他比我们起来还晚。其实就是来自于我们跟用户沟通的过程当中,我们觉得未来是什么样的,我们就去做这个事情,这个事情是别人已经做或者没做的。
李夏戎:说到创新,我们公司应该最主要关注的,像基因领域的数据技术,我们会围绕数据技术做一系列的创新性的工作。当然创新可能有些创新是颠覆性的,有些是微小的创新。数据交互大家通常采用U盘、硬盘的模式,我们变成线上交付,让数据流动起来,这可能从模式上来讲会是一个比较新的一个模式。但是其中涉及到很多故事是微小的一个一个点突破过来的。所以我相信创新应该是我们公司一直在做的一件事情。
主持人:我有两个观点:第一个基因测序行业可以想像成巨大的珍珠,每个公司上面都撬一点下来,撬下来越多就越值钱。如果坚持不懈的把所有的钻石表皮去掉,有可能钻石的价值就呈现出来。创新需要公司勤奋的去挖掘,表皮去掉;其次互联网+基因测序,以人为中心以后个性化的东西越来越多。整个产业除了测序服务公司、科技服务公司,药厂和科研机构,每个关系之间都可以发生关系。这些地方都存在创新的机会,取决于每个公司的立脚点、发力点,最终对于老百姓来说最终会有了不起的成绩出来。
提问:现在基因检测,针对个人来说可能有健康和临床两类,不管健康还是临床,未来都是大众享受的,因为现在我只看到京东上卖健康产品的,华大自己也有基因谱这一块,我想问一下在基因产品、基因检测产品这一块未来的推广模式到底有哪些?跟普通大众消费品的推广模式差别?另外基因检测出来的结果有很多好玩的东西,现在有些公司用基因检测结果找对象,未来基于基因检测有哪些更多创新的东西或者是模式出来,请问这三位。
李夏戎:我们不是做基因产品,主要做底下的数据平台的东西。所以说你提的问题,我觉得基因领域,它是带有一些想象力的,从技术上来讲,有那些更新的东西,我们现在所说的基因更多的在于基因数据的预处理阶段,还没有到基因数据大规模利用的阶段。现在局限于在我们说的预处理阶段,接下来这么大的数据出现之后,我们怎么用包括机器学习,包括现在比较火的大数据技术,这样的技术应用在这个领域上,这是我们公司所属的方向,我们看到的一个比较前沿的一些创新的应用。但我觉得这是需要一定的培养期,所以我们前面的这段预处理怎么能够让它更高效、标准,现在处在这个阶段。
郝向稳:下班的路上我经常问司机你们知道基因吗?很多司机说基因知道,高大上?但是不知道有没有用,经常说的这个事情。就像我们一开始你说互联网,可能就是游戏。基因这个东西如果能够一步一步的,像我们现在手机的应用一样方便的时候,基因才能逐步开始起来。我们现在用很多特别小的酒精的、叶酸的,酒精类的可以看看这个人喝酒的话代谢能力的强弱,然后是容易脸红;叶酸判断女性的代谢能力怎么样,并不是所有的女性都要服用大量的叶酸的,太小不满足孕妇的需求,太多影响身体状况。所以它对你的健康可以采取非常有帮助的措施。这种还是非常小的,这种在基因检测市场上有在做的,我们作为一个体验性的产品,大家可以试一下。测完以后有感受以后,你会觉得是不是真的能够影响?这样的基因应用越来越多,这样我们不同基因的组合,对我们健康、生活的影响会逐渐逐渐的像现在的互联网一样,没必要考虑基因怎么测,只会拿着这个信息用就行了。
官鑫:我是2011年底加入华大的,加入华大的时候有个想法,对于IT这样的工具,一定要跟行业结合,华大的个性化的、基因行业的东西吸引我。到两年以后开始推广的时候,有一个很深的体会,5年前的中国互联网大会上,我们第一次带着基因谱的品牌出现在互联网行业当中,淹没在一群阿里巴巴、腾讯这样的大公司当中。我哪一天早上稍微晚了一点去展位,我们的几个市场部的同事在半个小时以后声音就哑了,因为每个人第一句话问你华大基因来这儿干嘛?基因是干嘛的,他们要从头开始讲,华大基因干嘛,基因干嘛的。那时候第一天第一个采访我的新浪问我第一个是你们搞转基因,基因行业当时在认知当中就是转基因。我们确实要很致力于把基因跟人类的关系,给人带来的好处方面做很多的推广,我们也做了酒精基因检测,我分数很低,所以应酬的时候就会说我喝不了酒的,不拿开车的事情说了,拿这个报告说事。然后叶酸也是一样的。第三个糖耐受,我一喝牛奶就拉肚子,这样你知道了以后就知道不是你的胃病引起的,有很多这样的例子。包括耳聋,耳聋也是很经典的例子。有很多这样的故事,这些故事需要更多的人包括媒体大家一起努力传播给大众,这是我刚才提到的推广的事情。像我们做的一些好玩的应用,也是让大家很低的门槛了解到基因给你带来的关系,这是基因行业所谓的推广方面,或者是科普、教育方面要一起努力的。比如两三年前百度上搜基因,当时很少,现在有越来越多的相关的百科,用互联网的方法可以在基因的科普上起到很好的作用。把互联网传统的玩法玩转以后,再去谈好多创新的东西,我觉得基因的互联网是远远落后于其它的互联网的,更多的是学习。
提问:基因产品也是针对大众的,华大为什么不把产品放到淘宝京东上,为什么自己建立品牌?这样大众客户更难受及这个过程?
官鑫:这个问题挺深刻的,首先我们觉得华大的目的是基因科技造福人类,它其实不是为了去收买多少个基因检测,所以如果说我们暂时的判断一些电商网站只能帮我们带来收买的事情,我们可能不是最关注的,为什么要建这样的平台?其实是希望用自媒体的平台做更多的科普的推广,然后跟用户产生更多的连接。更重要的是希望打造一个平台,华大有很多很多的测序的能力,包括数据能力,大家刚才也提到这么多的数据都在基因公司,很大的部分在华大,基因的测序是用一个很安全的平台,支持行业的发展的。这个事情不是一个商城可以做的,这个其实是我们去自建一个护林王平台的主要目的。当然我们也会借助各种传统电商平台帮我们做一些推广和展现的过程,但是不能把它当做唯一的销售渠道和终极的目的。
主持人:这个问题我有一点不同意见,阿里非常认真考虑过双十一推广基因产品,用我们的名义发布这个产品,拿到第一个定单,可以选择性的根据产能交给在座的公司完成,这个东西对商业变现非常有意义,我们考虑第一是普及,第二是普惠,大众几十块钱可以享受到测叶酸、乳糖耐受、酒精,变成一个商品化东西以后,真的我认为现在没有是比这个渠道更方便的。这个我们不排斥,真的考虑过这个想法。我们双十一投放一个产品让大家拍,我们根据产能让大家做。
官鑫:一年前我们就跟天猫药馆讨论过这个问题,更多的时候还是因为整个全流程的服务,他跟我提了很多的建议,人对基因的认知有正面负面的,我们希望这个事情更加清楚的时候上天猫和京东这样的平台,并不是不上,只是我们上的稍微谨慎一点、慢一点。
郝向稳:我们在淘宝上开店了。后来又一个人特意找到我们,也是搜了一圈,当然没有在淘宝上下单,因为金额比较大。又是搜索以后,看了介绍,他也比较谨慎,开始是介绍到华大去的,比较了以后然后找到我们来测,进入淘宝天猫是非常好的推广渠道。我一直也很关注,最早的类似于京东的模式,把基因检测的套餐、跟运动有关的手环设备放在上面,相当于一体化的连接。
提问:继续补充一个,昨天我来的时候,跟车上的一些媒体也在问,他们说测完基因到底能干啥?大家说测不管健康也好临床也好,到底能干啥?测完酒可以指导我,可能大家都有这样的一个疑问,不管是健康还是临床,最终的意义在哪儿?
官鑫:我们有句口号叫做:改变从了解开始,了解从基因开始。什么意思?那么还有一个大家在医疗行业会比较熟知的四体医疗,我们可以托管一下叫参与式的健康生活。喝酒的事情,测完以后确实不可以改造你让你可以喝,但是你可以不喝。或者在用药方面,你可以知道这个药对你的效果是怎么样的。如果你了解了自己,你可以做参与式的健康生活,包括参与式的医疗。基因本身确实没有达到可以修改基因的阶段,更多的是让你了解自己。
郝向稳:海涛说了专业的问题,他比较了解。我们面向个人也经常问这个事情:做了基因检测可以干嘛?基因检测其实检测内容非常广泛,如果看一个人的疾病风险评估,会想到规避风险,包括刚才说的用药,还有环境因素的影响,这一类相关的微生物的检测做好,尽量把这种健康的影响降到最低。这两年特别火的技术叫做基因变异技术,前一段时间中国广州大学的一个教授,通过变异技术做了人的基因变异一个实验,引起了很大的争议,因为西方人不接受人的基因的变异,我出来两三年的时间,这个技术发展很快,包括在产业化上进步非常快,过不了几年可能这些人就得奖了。前半场知道基因,下半场就可能改变这个人的基因。比如你在怀孕的时候,如果知道胎儿有基因缺陷,将来的技术是有可能去做修复的。虽然基本上处于早期,但是我觉得随着技术的快速发展,这样的技术在基因检测完以后的应用上会起到作用。这只是其中的一方面,还有更多的我觉得健康管理、疾病预防,以前的健康管理跟疾病预防更多的是泛泛的,跑步去或者多喝水,泛泛的,每个人如果你知道他有高风险的疾病风险以后,你去针对性的做一些深度的健康管理的干预,这样其实就会远远大于我们做一个泛泛的建议好。
李夏戎:我觉得是这样的,其实应用跟技术本身,可能是一个鸡跟蛋的关系,我们无法说是先有鸡还是先有蛋,我觉得基因行业正处在这样一个交错上升的阶段。现在能够接收到的、看到的应用可能是有限的,华大基因的同学或者是郝总他们可以说一天各种各样的应用,但是大家接触的确实不多。这个恰恰说明了这个行业处在螺旋上升的时期,相信大家以后会看到更多的跟基因有关的技术。这个是可以期待的一个未来,现在有什么用?刚刚他们两位讲的比较具体了。
提问:云计算技术除了技术的优势,对我们日常工作产生什么影响?
官鑫:总体来讲,基因技术的测序包括分析的成本一直在下降。现在华大把测序致力于降到一千美金测一个人,当然分析的成本还需要加。分析和计算的成本可以通过云计算的技术可以去做。阿里云现在尝试的一个技术,用了400多个节点,每天四个多小时,每天可以处理几千个。华大以前有私有云,现在我们用公有私有云的方式结合做更多的资源利用调配。具体能够降到多少?在分析的层面,我不能完全回答你,因为这个也不完全负责这一块。至少我们对于测序成本,是能够降到一千美金左右。整个测序加分析,就可以给你一个完整的报告。未来当数据量越来越大的时候,你会发现测序本身变成越来越不重要,测序的数据会多次被利用、分析,成本会呈几何级的下降。比如现在测一个酒精采集唾液,现在测试又要采集一次,但是以后就可以进行多次分析。所以华大也承建了国家数据库,华大一直在做一个事情叫做:实时全景的健康数据,有些东西是十年测一次,有些是十年以后测它和现在的器官情况的变化。这里面一个是横向的,一个是你自己的数据的十年先十年后的对比,也能发现很多问题。这些都是云计算和数据这样的一些IT技术能够帮到的。
主持人:没有问题我们今天到这里,非常感谢各位媒体的到场,谢谢!