Select Star genera semillas para documentar automáticamente conjuntos de datos para científicos de datos

Select Star genera semillas para documentar automáticamente conjuntos de datos para científicos de datos

Cuando era un niño pequeño con una instalación de MySQL muy comprometida con la seguridad, solía responder a todas las solicitudes web con múltiples solicitudes de base de datos “SELECT *”. Bríndeme todos los datos y averiguaré qué hacer con ellos.

Hoy, en una organización moderna con un uso intensivo de datos, “SELECT *” lo matará. Con petabytes de información, decenas de miles de tablas (¡en el lado pequeño!) Y millones y quizás miles de millones de llamadas lanzadas al servidor de la base de datos, los equipos de ciencia de datos ya no pueden simplemente pedir todos los datos y comenzar a trabajar con ellos de inmediato.

Los macrodatos han llevado al aumento de almacenes de datos y lagos de datos (y aparentemente casas de lago de datos), infraestructura para que el acceso a los datos sea más robusto y sencillo. Sin embargo, todavía existe un problema de catalogación y descubrimiento: el hecho de que tenga todos sus datos en un solo lugar no significa que un científico de datos sepa qué representan los datos, quién los posee o qué podrían afectar esos datos en la gran cantidad de sitios web y aplicaciones de informes corporativos creadas sobre él.

Ahí es donde Seleccionar estrella entra. La startup, que se fundó hace aproximadamente un año en marzo de 2020, está diseñada para construir automáticamente metadatos dentro del contexto de un almacén de datos. A partir de ahí, ofrece una búsqueda de texto completo que permite a los usuarios encontrar datos rápidamente, así como señales de “mapa de calor” en sus resultados de búsqueda, que pueden identificar rápidamente qué columnas de un conjunto de datos son las más utilizadas por las aplicaciones dentro de una empresa y tienen más consultas que hacen referencia a ellos.

El producto es SaaS y está diseñado para permitir una rápida incorporación mediante la conexión al almacén de datos del cliente o la herramienta de inteligencia empresarial (BI).

La interfaz de Select Star permite a los científicos de datos comprender qué datos están mirando. Foto a través de Seleccionar estrella.

Shinji Kim, el único fundador y CEO, explicó que la herramienta es una solución a un problema que ha visto directamente en los equipos corporativos de ciencia de datos. Anteriormente fundó Concord Systems, una startup de procesamiento de datos en tiempo real que fue adquirida por Akamai en 2016. “La parte que noté es que ahora tenemos todos los datos y tenemos la capacidad de calcular, pero ahora el próximo desafío es saber qué son los datos y cómo usarlos”, explicó.

Dijo que “el conocimiento tribal está empezando a desperdiciarse más [in] tiempo y dolor en empresas en crecimiento ”y señaló que grandes empresas como Facebook, Airbnb, Uber, Lyft, Spotify y otras han creado sus propias herramientas de descubrimiento de datos de fabricación casera. Su misión para Select Star es permitir que cualquier corporación acceda rápidamente a una plataforma fácil de usar para resolver este problema.

La compañía recaudó una ronda semilla de $ 2.5 millones liderada por Bowery Capital con la participación de Background Capital y varios ángeles prominentes, incluidos Spencer Kimball, Scott Belsky, Nick Caldwell, Michael Li, Ryan Denehy y TLC Collective.

Las herramientas de descubrimiento de datos han existido de alguna forma durante años, con empresas populares como Alation habiendo recaudado decenas de millones de dólares de capital riesgo a lo largo de los años. Kim ve una oportunidad para competir ofreciendo una mejor experiencia de incorporación y también automatizando gran parte del flujo de trabajo que sigue siendo manual para muchas herramientas alternativas de descubrimiento de datos. Con muchas de estas herramientas, “no hacen el trabajo de conectar y construir la relación” entre los datos, dijo, y agregó que “la documentación sigue siendo importante, pero puede generar automáticamente [metadata] permite que los equipos de datos obtengan valor de inmediato “.

Seleccione el equipo de Star, con el CEO y fundador Shinji Kim en la fila superior, en el medio. Foto a través de Seleccionar estrella.

Además de solo comprender los datos, Select Star puede ayudar a los ingenieros de datos a comenzar a descubrir cómo cambiar sus bases de datos sin generar errores en cascada. La plataforma puede identificar cómo se utilizan las columnas y cómo un cambio en una puede afectar a otras aplicaciones o incluso a otros conjuntos de datos.

Select Star sale de la beta privada hoy. El equipo de la compañía cuenta actualmente con siete personas, y Kim dice que están enfocados en hacer crecer el equipo y hacer que sea aún más fácil incorporar usuarios para fin de año.


Source link