如何评价Google Genomics API?


有谁关注或试用过Google Genomics API?如何评价,与DNAnexus的API和SDK相比有什么不同?
已邀请:

Google Genomics API 目前支持数据存储和查看,但不支持序列比对,估计未来2到3年内也不会支持序列比对,目前还没有这个计划

赞同来自: unionx 许岳楷 还是地雷


先说一下Genomics API。这是Global Alliance of Genomics and Health组织下的Data Working Group的作品。当然,Google是其中的主力主力之一,其他的大神包括Durbin、Haussler等人。

这个API的目的是为了建立起全球范围内基因组数据存储系统对外提供API的标准。很多机构,例如BGI、国家基因库、NCBI、EBI、Google等都在建立自己的基因组数据存储系统。

但数据光存着显然没什么意义,要利用起来。于是,我们相信会有更多的大大小小的公司基于这些数据去开发应用。这时候,这些数据存储机构提供的接口肯定是五花八门的。比较low的可能就直接ftp了,当然更大的可能是建立web service做一些控制,底层也可以做一些优化。Genomics API的目的就是为了统一这些接口。如果大家都能遵守这些接口,上层的应用就可以应用到各个机构存储的数据上。

Google为了演示这些接口的时候,已经开发了一些东西。比如,你可以把BAM文件放在Google的Cloud Storage上,然后导入Google Genomics。Google Genomics API是GA4GH制定的Genomics API标准的一个实现,所以只要是兼容Genomics API的应用都可以访问Google Genomics里面的数据。

为了保证这些基因组数据的访问效率,Google Cloud Storage和Google Genomics肯定在底层做了不少事情。为了演示这些API的使用,Google也开发了一些应用,详见:https://github.com/googlegenomics

所以,无论是想提供存基因组数据的服务,还是想开发基因组的应用,最好是能兼容GA4GH的这套Genomics API。

BTW,阿里云,七牛,你们什么时候跟上?好吧,也问问国家基因库:)

至于跟DNANexus的API的关系,没多大关系。不过以后你存储在DNANexus或者Seven Bridges Genomics上的基因组数据应该是很有可能会支持Genomics API的

赞同来自: 许岳楷


谷歌在其官方博客中称,由于看重基因测序和健康领域,谷歌加入一个致力于为人类健康提供更好的标准、政策以及技术的全球联盟(Global Alliance)组织。在这一领域谷歌将充分发挥自己在技术以及健康研究方面的独特优势。

谷歌提供一个开源项目 API 的端口,帮助用户大规模导入、处理、存储和搜索基因组数据,从而实现用户仅仅利用 API 端口,将能方便地将数据储存在谷歌的云端服务器上。

谷歌的这个基因组 API 一开始就将专注于如下内容:
1、专注于科学,而不是服务器和文件格式
2、安全地存储基因组数据
3、尽可能多地存储数据

尽管目前潜在的用户如需访问数据库,仍需要向谷歌申请基因组 API 访问请求,但终有一天,谷歌会把这个决定权交予全球联盟来决定。

谷歌表示此举将是全球卫生和医疗环境的一次重大变革,同时也会引起全球联盟其他成员的兴趣即:如何将数据科学同生命科学结合在一起。

要回复问题请先登录注册