Con $ 21 millones en fondos, Code Ocean tiene como objetivo ayudar a los investigadores a replicar la ciencia con gran cantidad de datos

Con $ 21 millones en fondos, Code Ocean tiene como objetivo ayudar a los investigadores a replicar la ciencia con gran cantidad de datos

Cada rama de la ciencia depende cada vez más de los análisis y conjuntos de macrodatos, lo que significa una creciente confusión de formatos y plataformas; más que inconveniente, esto puede dificultar el proceso de revisión por pares y replicación de la investigación. Código Ocean espera facilitar la colaboración de los científicos creando un formato y una plataforma flexibles y compartibles para todos y cada uno de los conjuntos de datos y métodos, y ha recaudado un total de 21 millones de dólares para desarrollarlo.

Ciertamente hay un aire de “¿Demasiadas opciones? ¡Prueba este! ” a esto (y aquí está el requisito XKCD relevante). Pero Code Ocean no está creando un competidor para herramientas exitosas como Jupyter o Gitlab o Docker; es más una plataforma de contenedores a pequeña escala que le permite reunir todos los componentes necesarios de sus datos y análisis en un formato fácilmente compartido, sea cual sea la plataforma. viven de forma nativa.

El problema surge cuando necesitas compartir lo que estás haciendo con otro investigador, ya sea que esté en el banco de tu lado o en una universidad de todo el país. Es importante para fines de replicación que el análisis de datos, al igual que cualquier otra técnica científica, se realice exactamente de la misma manera. Pero no hay garantía de que su colega utilice las mismas estructuras, formatos, notación, etiquetas, etc.

Eso no significa que sea imposible para compartir su trabajo, pero agrega muchos pasos adicionales, ya que los posibles replicadores o iteradores verifican y verifican que todos los métodos sean iguales, que las mismas versiones de las mismas herramientas se estén utilizando en el mismo orden, con la misma configuración, y así sucesivamente. Una pequeña inconsistencia puede tener grandes repercusiones en el futuro.

Resulta que este problema es similar en cierto modo a la cantidad de servicios en la nube que se activan. Las implementaciones de software pueden ser tan delicadas como los experimentos científicos, y una solución son los contenedores, que como pequeñas máquinas virtuales incluyen todo lo necesario para realizar una tarea informática, en un formato portátil compatible con muchas configuraciones diferentes. La idea es natural para transferirla al mundo de la investigación, donde puede vincular los datos, el software utilizado y las técnicas y procesos específicos utilizados para alcanzar un resultado dado, todo en un paquete ordenado. Ese, al menos, es el tono que Code Ocean ofrece para su plataforma y “Compute Capsules”.

Diagrama que muestra cómo "computar cápsula" incluye código, entorno y datos.

Supongamos que es un microbiólogo que analiza la eficacia de un compuesto prometedor en determinadas células musculares. Estás trabajando en R, escribiendo en RStudio en una máquina Ubuntu, y tus datos son tal o cual recopilados durante una observación in vitro. Si bien, naturalmente, declararía todo esto cuando publique, no hay garantía de que alguien tenga una computadora portátil Ubuntu con una configuración de Rstudio que funcione, por lo que incluso si proporciona todo el código, podría ser en vano.

Sin embargo, si lo pones en Code Ocean, así, hace que todo el código relevante esté disponible y pueda ser inspeccionado y ejecutado sin modificar con un clic, o manipulado si un colega se pregunta sobre una determinada pieza. Funciona a través de un solo enlace y una aplicación web, multiplataforma e incluso se puede incrustar en una página web como un documento o un video. (Voy a intentar hacer eso a continuación, pero nuestro backend es un poco quisquilloso. La cápsula en sí es aquí.)

Sin embargo, más que eso, la Compute Capsule puede ser reutilizada por otros con nuevos datos y modificaciones. Tal vez la técnica que pones en línea es una herramienta de análisis de secuencia de ARN de propósito general que funciona siempre que la alimentes con datos formateados correctamente, y eso es algo que otros habrían tenido que codificar desde cero para aprovechar algunas plataformas.

Bueno, pueden simplemente clonar su cápsula, ejecutarla con sus propios datos y obtener sus propios resultados además de verificar los suyos. Esto se puede hacer a través del sitio web de Code Ocean o simplemente descargando un archivo zip de todo y haciendo que se ejecute en su propia computadora, si tienen una configuración compatible. Se pueden encontrar algunas cápsulas de ejemplo más aquí.

Captura de pantalla del entorno del banco de trabajo Code Ocean.

Créditos de imagen: Código Ocean

Este tipo de polinización cruzada de técnicas de investigación es tan antiguo como la ciencia, pero la experimentación moderna con gran cantidad de datos a menudo termina aislada porque no se puede compartir y verificar fácilmente a pesar de que el código está técnicamente disponible. Eso significa que otros investigadores siguen adelante, construyen lo suyo y refuerzan aún más el sistema de silos.

En este momento hay alrededor de 2.000 cápsulas informáticas públicas en Code Ocean, la mayoría de las cuales están asociadas con un artículo publicado. La mayoría también ha sido utilizada por otros, ya sea para replicar o probar algo nuevo, y algunas, como bibliotecas de código fuente abierto ultra específicas, han sido utilizadas por miles.

Naturalmente, existen preocupaciones de seguridad cuando se trabaja con datos privados o médicamente sensibles, y el producto empresarial permite que todo el sistema se ejecute en una plataforma de nube privada. De esa manera sería más una herramienta interna, y en las principales instituciones de investigación que en sí misma podría ser bastante útil.

Code Ocean espera que al ser lo más inclusivo posible en términos de bases de código, plataformas, servicios informáticos, etc., contribuirá a un entorno más colaborativo a la vanguardia.

Claramente, esa ambición es compartida por otros, ya que la compañía ha recaudado $ 21 millones hasta ahora, $ 6 millones de los cuales fueron en inversiones no reveladas anteriormente y $ 15 millones en una ronda A anunciada hoy. La ronda A fue dirigida por Battery Ventures, con la participación de Digitalis Ventures, EBSCO y Vaal Partners, así como muchos otros.

El dinero permitirá a la empresa seguir desarrollando, escalando y promocionando su plataforma. Con suerte, pronto se encontrarán entre el aire enrarecido que a menudo respira este tipo de SaaS inteligente: necesario, profundamente integrado y rentable.


Source link