O Instituto Nacional do Câncer dos EUA compartilha uma grande quantidade de dados com estudiosos de todo o planeta por meio do Google Cloud.
Depois de usar o BigQuery do Google Cloud para analisar conjuntos de dados massivos de dados genômicos e proteômicos rapidamente, pesquisadores sênior do Instituto Nacional do Câncer dos EUA agora estão disponibilizando suas ferramentas e recursos para a comunidade de pesquisa mais ampla. Aproveitando a nuvem, os pesquisadores esperam acelerar pesquisas sobre o câncer que pode salvar vidas e, ao mesmo tempo, manter seus dados seguros e em conformidade com as diferentes regras nacionais e internacionais, disse o Google na quinta-feira.
Os dados em questão vêm especificamente do Instituto de Biologia de Sistemas-Portal do Câncer na Nuvem (ISB-CGC) – parte dos Recursos de Nuvem do Instituto Nacional do Câncer dos EUA. O NCI criou Cloud Resources para que os cientistas não precisassem baixar e armazenar conjuntos de dados extremamente grandes.
Instituto Nacional do Câncer dos EUA compartilha dados de pesquisa por meio do Google Cloud
Essas plataformas baseadas em nuvem eliminam a necessidade dos pesquisadores de baixar e armazenar conjuntos de dados extremamente grandes, permitindo-lhes trazer ferramentas de análise para os dados na nuvem, em vez do processo tradicional de trazer os dados para as ferramentas no hardware local. Os recursos de nuvem também fornecem acesso à capacidade computacional sob demanda para analisar esses dados. Os recursos em nuvem permitem que os usuários executem ferramentas de melhores práticas e pipelines já implementados ou carreguem seus próprios dados ou métodos de análise para espaços de trabalho.
Todos os três recursos em nuvem fornecem suporte para acesso a dados por meio de uma interface de usuário baseada na web, além de acesso programático a ferramentas analíticas e fluxos de trabalho, e a capacidade de compartilhar resultados com colaboradores. Cada Cloud Resource está continuamente desenvolvendo novas funcionalidades para melhorar a experiência do usuário e adicionar novas ferramentas para pesquisadores.
Com o ISB-CGC no Google Cloud, dois pesquisadores desenvolveram um conjunto de funções definidas pelo usuário (UDFs) do Google BigQuery para realizar testes estatísticos em dados de câncer de mama. Usando as UDFs, a análise que levaria dias com um programa local levou apenas alguns minutos para ser concluída.
Os pesquisadores – Dr. Kawther Abdilleh, cientista chefe de bioinformática da General Dynamics Information Technology, e Dr. Boris Aguilar, pesquisador sênior da ISB – agora disponibilizaram seus UDFs para outros pesquisadores por meio do BigQuery.
“Estamos espalhando a mensagem da relação custo-benefício da nuvem”, disse Abdilleh em um comunicado.“ Com o BigQuery do Google Cloud, demonstramos com sucesso que os pesquisadores podem analisar grandes quantidades de dados de maneira econômica e mais rápida do que nunca.”