Ícono del sitio La Neta Neta

Narrador recauda $ 6.2 millones para un nuevo enfoque para el modelado de datos que reemplaza el esquema de estrella

Narrador recauda $ 6.2 millones para un nuevo enfoque para el modelado de datos que reemplaza el esquema de estrella

Snowflake salió a bolsa esta semana y, como muestra del ecosistema más amplio que está evolucionando en torno al almacenamiento de datos, una startup que ha creado un concepto completamente nuevo para modelar datos almacenados anuncia financiación. Narrador — que utiliza un modelo de ordenación de 11 columnas en lugar de un esquema en estrella estándar para organizar los datos para el modelado y el análisis — ha obtenido una ronda de la Serie A de $6,2 millones, dinero que planea usar para ayudarlo a lanzar y crear usuarios para su propio -servir la versión de su producto.

La financiación está siendo liderada por Initialized Capital junto con la inversión continua de Flybridge Capital Partners y Y Combinator, donde la puesta en marcha estaba en una cohorte de 2019, así como nuevos inversores, incluido Paul Buchheit.

Narrador existe desde hace tres años, pero su primera fase se basó en proporcionar modelado y análisis directamente a las empresas como una consultoría, ayudando a las empresas a reunir fuentes de datos estructurados y dispares de marketing, CRM, mesas de soporte y bases de datos internas para trabajar como una unidad unificada. entero. Como consultores, usando una versión anterior de la herramienta que ahora está lanzando, el CEO de la compañía, Ahmed Elsamadisi, dijo que él y otros hicieron malabarismos con las consultas “para ocho grandes empresas sin ayuda de nadie”, mientras que los análisis profundos fueron realizados por otra sola persona.

Habiendo validado que funciona, la nueva versión de autoservicio tiene como objetivo brindar a los científicos y analistas de datos una forma simplificada de ordenar datos para que las consultas, descritas como análisis procesables en un formato similar a una historia, o “Narrativas”, como los llama la compañía, se puede hacer a través de esos datos rápidamente (horas en lugar de semanas) y de manera consistente. (Puede ver una demostración de cómo funciona a continuación proporcionada por la jefa de datos de la compañía, Brittany Davis).

Los nuevos datos como servicio también carillo en niveles de SaaS, con un nivel gratuito para los primeros 5 millones de filas de datos y una escala móvil de precios después de eso basada en filas de datos, números de usuario y Narrativas en uso.

Créditos de imagen: Narrador

Elsamadisi, quien cofundó la startup con Matt Star, Cedric Dussud y Michael Nason, dijo que los analistas de datos han vivido durante mucho tiempo con los problemas del modelado de esquemas en estrella (y, por extensión, el formato relacionado del esquema de copo de nieve), que se puede resumir como “capas de dependencias, falta de fuente de la verdad, números que no coinciden y mantenimiento interminable”, dijo.

“En esencia, cuando tienes muchas tablas construidas a partir de un montón de SQL complejo, terminas con un castillo de naipes en crecimiento que requiere la necesidad de contratar constantemente a más personas para ayudar a garantizar que no se derrumbe”.

(Nosotros)Experiencia laboral

Fue mientras trabajaba como científico principal de datos en WeWork. Sí, me dijo, tal vez en realidad no era una empresa de tecnologíapero tenía “tecnología en su núcleo”: tuvo un momento decisivo al darse cuenta de cómo reestructurar los datos para solucionar estos problemas.

Antes de eso, las cosas eran difíciles en el frente de datos. WeWork tenía 700 tablas que su equipo administraba mediante un enfoque de esquema en estrella, que abarcaba 85 sistemas y 13 000 objetos. Los datos incluirían información sobre la adquisición de edificios, los flujos de clientes a través de esos edificios, cómo cambiarían las cosas y los clientes podrían abandonar, con el marketing y la actividad en las redes sociales, etc., creciendo en línea con el propio imperio de escala rápida de la empresa. Todo eso significó un desastre al final de los datos.

“Los analistas de datos no podrían hacer su trabajo”, dijo. “Resulta que apenas pudimos responder preguntas básicas sobre las cifras de ventas. Nada coincidía y todo tomó demasiado tiempo”.

El equipo tenía 45 personas, pero aun así tuvo que implementar una jerarquía para responder preguntas, ya que había muchas y no había suficiente tiempo para investigar y responderlas todas. “Y teníamos todas las herramientas de datos que había”, agregó. “Mi equipo odiaba todo lo que hacían”.

El modelo de columna de una sola tabla que usa Narrador, dijo, “había sido teorizado” en el pasado pero no había sido descubierto.

La chispa, dijo, fue pensar en datos estructurados de la misma manera que hacemos preguntas, donde, como él lo describió, cada pieza de datos se puede unir y luego también se puede usar para responder múltiples preguntas.

“La principal diferencia es que estamos usando una tabla de series de tiempo para reemplazar todos sus modelos de datos”, explicó Elsamadisi. “Esta no es una idea nueva, pero siempre se consideró imposible. En resumen, abordamos el mismo problema que la mayoría de las empresas de datos para facilitar la obtención de los datos que desea, pero somos la única empresa que lo resuelve innovando en el enfoque de modelado de datos de nivel más bajo. Honestamente, es por eso que nuestra solución funciona tan bien. Reconstruimos la base de los datos en lugar de intentar mejorar una base defectuosa”.

Narrador llama a la tabla compuesta, que incluye todos sus datos reformateados para encajar en su estructura de 11 columnas, el Últimas acciones.

Elsamadisi dijo que usar Narrador por primera vez toma alrededor de 30 minutos y alrededor de un mes para aprender a usarlo a fondo. “Pero no vas a volver a SQL después de eso, es mucho más rápido”, agregó.

El mercado inicial de Narrador ha estado brindando servicios a otras empresas de tecnología, y específicamente a nuevas empresas, pero el plan es abrirlo a un conjunto mucho más amplio de verticales. Y en un movimiento que podría ayudar con eso, a más largo plazo, también planea abrir el código fuente de algunos de sus componentes principales para que terceros puedan crear productos de datos sobre el marco más rápidamente.

En cuanto a los competidores, dice que son esencialmente las herramientas que él y otros científicos de datos siempre han usado, aunque “vamos en contra de un enfoque de ‘mejores prácticas’ (esquema de estrella), no de una empresa”. Airflow, DBT, LookML de Looker, Visual SQL de Chartio, Tableau Prep son formas de crear y permitir el uso de un esquema en estrella tradicional, agregó. “Somos similares a estas empresas, tratando de hacer que sea lo más fácil y eficiente posible generar las tablas que necesita para BI, informes y análisis, pero esas empresas están limitadas por el enfoque tradicional de esquema en estrella”.

Hasta ahora la prueba ha estado en los datos. Narrador dice que las empresas promedian alrededor de 20 transformaciones (la unidad utilizada para responder preguntas) en comparación con cientos en un esquema en estrella, y que esas transformaciones promedian 22 líneas en comparación con más de 1000 líneas en el modelado tradicional. Para aquellos que aprenden a usarlo, el tiempo promedio para generar un informe o ejecutar algún análisis es de cuatro minutos, en comparación con las semanas del modelado de datos tradicional.

“Narrator tiene el potencial de establecer un nuevo estándar en datos”, dijo Jen Wolf, COO y socia de Initialized Capital y nuevo miembro de la junta de Narrador, en un comunicado. “Nos sorprendió ver la calidad y la velocidad con la que Narrator entregó análisis utilizando su producto. Confiamos en que una vez que el mundo experimente Narrador, esta será la forma en que se enseñará el análisis de datos en el futuro”.


Source link
Salir de la versión móvil