Los datos son la base de casi todos los aspectos de la ciencia, la tecnología y la industria modernas, lo que hace que la gestión de datos y la accesibilidad sean los principales impulsores de la innovación. Las herramientas, incluidos los sistemas de gestión de información de laboratorio (LIMS) y los sistemas avanzados de gestión del conocimiento basados en IA, son cada vez más críticos para garantizar que los datos puedan ser utilizados y reutilizados de manera eficiente por todas las partes interesadas relevantes. Reconociendo esta importancia, un consorcio de científicos y organizaciones de 2016 países desarrolló los Principios de Datos FAIR como guía para garantizar que los datos se gestionen para lograr el mayor impacto.
Los cuatro principios fundamentales hacen hincapié en que los datos deben ser:
- Findable, fácil de descubrir a través del etiquetado y la organización adecuados
- Unaccesible, por lo que se puede recuperar de forma segura, preferiblemente a través de protocolos estandarizados
- Interoperable, accesible a través de varios medios
- Reutilizable en diferentes contextos
Hemos descubierto que la implementación de los principios de datos FAIR para LIMS como LabVantage, interfaces de lenguaje de IA como Biomax AILANI y otras herramientas en las industrias de investigación y biociencias comerciales conduce a una serie de beneficios notables. Lo primero y más importante es la colaboración eficiente, que mejora la innovación y el descubrimiento, al tiempo que ahorra tiempo y esfuerzo al mejorar el acceso a los datos, lo que puede, por ejemplo, ayudar a evitar la duplicación. La orientación FAIR también mejora la calidad y la fiabilidad de los datos, así como la sostenibilidad de los datos a largo plazo.
Aplicación de los principios de datos FAIR en LIMS
Los LIMS se utilizan para gestionar el flujo de información en entornos de laboratorio, desde el seguimiento de muestras y la recopilación de datos experimentales hasta la elaboración de informes y el control de calidad. Si bien algunas personas piensan en un LIMS como un repositorio, la alineación con los principios de FAIR los transforma en ejes centrales para la colaboración, lo que garantiza que los datos puedan ser fácilmente accedidos, comprendidos y utilizados tanto por los miembros actuales como por los futuros del equipo o socios externos.
LIMS debe hacer que los datos se puedan encontrar a través de metadatos adecuados, identificadores persistentes (como URI) y repositorios bien organizados. LIMS se puede diseñar con generación automatizada de metadatos, que incorpora protocolos de generación de metadatos en el flujo de trabajo del laboratorio. De esta manera, cada muestra, resultado y paso experimental se documenta con precisión.
La accesibilidad puede tener una connotación de acceso abierto para cualquier persona, pero bajo FAIR, esto realmente significa garantizar mecanismos de autenticación y autorización adecuados sin imponer barreras indebidas. Los LIMS necesitan controles de acceso seguros que equilibren la accesibilidad con la confidencialidad, permitiendo a los usuarios autorizados localizar y ver los datos mientras documentan cualquier restricción (por ejemplo, previa solicitud o mediante suscripción).
La interoperabilidad es uno de los principales requisitos para un LIMS. Los datos son más útiles cuando se pueden integrar y procesar en diversas plataformas, herramientas y lenguajes. En la práctica, un LIMS que cumpla con FAIR satisface las necesidades de los laboratorios modernos al permitir un intercambio de datos fluido entre todas las plataformas de software comúnmente empleadas, como los cuadernos electrónicos de laboratorio (ELN) y las herramientas de análisis de datos.
Los datos de un LIMS deben describirse de forma coherente y con suficiente detalle para garantizar su reutilización. Un LIMS permite esto con la captura de datos estandarizada, de modo que todos los datos experimentales, desde las lecturas de los instrumentos hasta los detalles de las muestras, siguen convenciones de nomenclatura y ontologías coherentes. La reutilización de datos para la replicabilidad, o para evitar duplicaciones innecesarias, depende de los metadatos completos, la procedencia y los datos de licencias.
FAIR Data mejora las interfaces lingüísticas de IA
Una de las mayores ventajas de las grandes bases de datos interoperables es el potencial de aprovechar las herramientas de IA y aprendizaje automático, como LabVantage Biomax AILANI (Artificial Intelligence LANguage Interface). Esta clase de IA permite una potente integración semántica y capacidades de búsqueda que pueden facilitar la identificación y entrega de datos científicamente relevantes.
Cumplir con los principios de FAIR significa que una interfaz de lenguaje de IA debe facilitar a los investigadores de ciencias de la vida la localización y el acceso a la información relevante. Se basa en datos bien organizados y coherentes, lo que hace que los modelos de aprendizaje automático sean más eficaces. AILANI, por ejemplo, integra e indexa conjuntos de datos de múltiples fuentes, lo que garantiza que los datos valiosos no permanezcan ocultos. Los métodos de aprendizaje automático se pueden aplicar de manera efectiva para descubrir patrones ocultos, acelerar la validación de hipótesis e incluso proponer nuevas direcciones de investigación.
La interoperabilidad se basa en el uso coherente de formatos, vocabularios y estándares para que los diferentes sistemas (equipos de laboratorio, bases de datos, software analítico) puedan "hablar" entre sí de manera efectiva. Al estandarizar ontologías y formatos, AILANI garantiza que los algoritmos de aprendizaje automático puedan analizar y comparar de manera significativa diversos conjuntos de datos: datos genómicos, ensayos clínicos, bases de datos de literatura y más.
Las directrices de FAIR también exigen estándares de metadatos claros que permitan a los investigadores aprovechar la IA para evaluar la calidad, la procedencia y la relevancia de los datos, lo que les permite volver a aplicar los resultados en nuevos contextos. Garantizar descriptores de calidad, derechos de uso claros y documentación sólida puede desbloquear el potencial de la reutilización de datos para nuevos fines, como la reutilización de fármacos o los estudios de estratificación de pacientes.
Habilitación de una mejor ciencia con los datos FAIR
Adherirse a los principios de datos FAIR tiene muchas ventajas en todas las industrias basadas en la ciencia, incluso para el cumplimiento normativo, la colaboración interdisciplinaria y la creación de valor a largo plazo. Estos estándares están integrados en herramientas como la plataforma LabVantage LIMS y LabVantage Biomax AILANI, lo que facilita una investigación y una ciencia industrial más eficientes y de alta calidad. La mayor capacidad de acceder y aprovechar los conjuntos de datos masivos y crecientes de cada organización impulsará la próxima ola de descubrimiento y progreso, y garantizará que los descubrimientos de vanguardia no permanezcan enterrados.