Por qué los genetistas odian realmente Microsoft Excel

Por qué los genetistas odian realmente Microsoft Excel

logotipo de microsoft excel

Microsoft Corporation / Dominio público

  • Los científicos del Comité de Nomenclatura Genética de HUGO han cambiado los nombres de ciertos genes que no funcionan bien con Excel.
  • Eso es porque algunos genes, como SEPT1, se auto-formatean a fechas en hojas de cálculo de Excel (el comité renombró ese gen SEPTIN1, por ejemplo).
  • Describen los nuevos estándares en un artículo publicado en la revista. Nature Genetics.

    Los genes humanos y las entradas de datos de Excel simplemente no se llevan bien.

    Según el Proyecto del Genoma Humano, cada uno de nosotros tiene entre 20.000 y 25.000 genes dentro de nuestro cuerpo, que constituyen nuestras características físicas. Debido a que tenemos tantos genes, los científicos le dan a cada uno un nombre único, según los Institutos Nacionales de Salud.

    BUCEAR MÁS PROFUNDO ➡ Leer las mejores características de salud, tecnología y ciencia de su clase, y obten acceso ilimitado a Pop Mech, comenzando ahora.

    Pero la nomenclatura puede ser larga y técnica, por lo que los investigadores la acortan rutinariamente con una versión abreviada, llamada símbolo. Un gen en el cromosoma 7 que se ha asociado con la fibrosis (regulador de la conductancia transmembrana de la fibrosis quística) se convierte en CFTR, por ejemplo.

    Solo un problema: Excel lo hace no juega bien con ciertos símbolos genéticos, convirtiéndolos en fechas. Eso es extremadamente problemático, ya que los investigadores deben poder compartir cantidades masivas de datos. No pueden desactivar las opciones de formato automático, e incluso cambiar el tipo de datos para ciertas columnas aún puede introducir errores.

    Los expertos del Comité de Nomenclatura Genética de HUGO (HGNC), la organización de estándares para nombrar genes, con sede en Hinxton, Inglaterra, han tenido suficiente. Han publicado un artículo en la revista. Genética de la naturaleza, esbozar un nuevo conjunto de reglas para nombrar ciertos genes (y las proteínas correspondientes que expresan) que dan lugar a errores de entrada de datos.

    “La denominación de genes estandarizada es crucial para la comunicación eficaz sobre los genes y, a medida que la genómica se vuelve cada vez más importante en la atención médica, la necesidad de un lenguaje coherente para referirse a los genes humanos se vuelve cada vez más esencial”, escriben los autores.

    Estas actualizaciones incluyen cambios en todos los símbolos que se convierten automáticamente a fechas en Excel. Por ejemplo, SEPT1, un gen que se encuentra en el cromosoma 16 humano, que codifica una proteína que puede contribuir a los ovillos neurofibrilares asociados con la enfermedad de Alzheimer, ahora se convierte en SEPTIN1. MARCH1, otro gen que codifica una proteína que se encuentra en el cromosoma 4, ahora es MARCHF1.

    Este contenido se importa de Twitter. Es posible que pueda encontrar el mismo contenido en otro formato, o puede encontrar más información, en su sitio web.

    Hasta la fecha, HGNC ha cambiado 27 nombres de genes de esta manera, dice Elspeth Bruford, coordinadora de HGNC. El borde. “Consultamos a las respectivas comunidades de investigación para discutir las actualizaciones propuestas y también notificamos a los investigadores que habían publicado sobre estos genes específicamente cuando los cambios se estaban aplicando”, dice.

    Este problema ha sido un dolor de cabeza constante para los investigadores de genómica durante algún tiempo. Un estudio de agosto de 2016 publicado en la revista Biología del genoma descubrió que Microsoft Excel y otros programas de hojas de cálculo similares han provocado que alrededor del 20 por ciento de los artículos de genética contengan errores.

    Los investigadores descargaron y examinaron archivos complementarios de más de 35.000 artículos en 18 revistas entre 2005 y 2015. De ellos, alrededor de 3.600 utilizaron hojas de cálculo de Excel para proporcionar una lista de los genes a los que se hace referencia en la notación. Uno de cada cinco de los contenidos al menos un error. Este problema, según el documento, se remonta a 2004.

    “La conversión inadvertida de símbolos genéticos es problemática porque estos archivos complementarios son un recurso importante en la comunidad genómica que se reutilizan con frecuencia”, escribieron los autores. “Nuestro objetivo aquí es crear conciencia sobre el problema”.

    Este contenido se importa de {embed-name}. Es posible que pueda encontrar el mismo contenido en otro formato, o puede encontrar más información, en su sitio web.

    Ahora que HGNC finalmente ha resuelto estos problemas con la nomenclatura actualizada, los genetistas deberían poder dormir mejor por la noche. Aún así, suena como un montón de problemas para buscar algunas hojas de cálculo, ¿verdad? ¿Por qué Excel no podía simplemente dejar de formatear automáticamente los genes en fechas?

    Los nombres de los genes humanos pueden cambiar, pero las pesadillas de Excel vivirán para siempre.

    Este contenido es creado y mantenido por un tercero y se importa a esta página para ayudar a los usuarios a proporcionar sus direcciones de correo electrónico. Es posible que pueda encontrar más información sobre este y contenido similar en piano.io


Source link