Inteligencia Artificial: la Diferencia Está en los Datos
El rápido aumento y el potencial transformador de la IA generativa (GenAI) están marcando el camino para que se convierta en el sello distintivo de la economía moderna. Prevemos que la gama de oportunidades y riesgos de inversión crecerá a medida que la IA altere las economías y las industrias, y la dispersión entre los ganadores y los perdedores se ampliará. Como ya hemos destacado anteriormente, los posibles beneficiarios pueden encontrarse más allá del grupo concentrado de grandes empresas estadounidenses que hasta ahora han impulsado el mercado de renta variable al alza. Se trata de beneficiarios de primer orden, a los que llamamos “habilitadores”, incluidos los fabricantes de semiconductores. Creemos que el siguiente conjunto de posibles beneficiarios se puede encontrar en el segmento de “datos y seguridad”.
La cantidad de datos que se están creando crece exponencialmente. Además, los conjuntos de datos son cada vez más grandes, más desestructurados y más complejos. Esto crea un entorno ideal para el desarrollo de tecnologías de IA innovadoras, como grandes modelos de lenguaje. Sin embargo, los estudios sugieren que uno de los principales obstáculos que impide a las empresas ampliar sus ambiciones de IA es la gestión de datos, desde la recopilación y el almacenamiento hasta la depuración y la protección.1 Creemos que las empresas de todo el ecosistema tecnológico que puedan ayudar con estas tareas se beneficiarán de forma desproporcionada con la evolución de la IA.
Fuente: Domo, publicado originalmente en septiembre de 2022 y revisado posteriormente. Ninguna referencia a una empresa o valor específicos constituye una recomendación de compra, venta, mantenimiento o inversión directamente en la empresa o sus valores.
De la Recopilación a la Protección
Recopilación
Los grandes modelos de lenguaje comercialmente accesibles que empiezan a surgir, como ChatGPT, requieren una gran cantidad de potencia informática y memoria. Pero, en última instancia, se ejecutan con datos. A lo largo de la fase de entrenamiento, los grandes modelos de lenguaje detectan patrones y relaciones en los datos introducidos. A continuación, el modelo predice los resultados. Para preparar mejor un modelo para su escala y alcance de uso deseados, es esencial contar con una amplia gama de datos relevantes, precisos y completos. Sin embargo, a los CEO les preocupa que el linaje y la procedencia de los datos sean una barrera para adoptar la GenAI.2
Los datos se dividen en dos categorías: estructurados y no estructurados. En su forma bruta, los datos estructurados son cuantitativos y, por lo tanto, organizados. Los datos no estructurados son cualitativos (como audio, vídeo y publicaciones en redes sociales) y requieren un esfuerzo de interpretación adicional. Aunque los datos estructurados son más fáciles de descifrar, los datos no estructurados proporcionan una comprensión más profunda de los hábitos y el comportamiento cuando se analizan de forma eficaz, lo que proporciona resultados más significativos y conclusiones mejoradas.
Para entrenar a los modelos al máximo potencial, los ingenieros de datos recopilan una combinación de datos estructurados y no estructurados para incorporarlos en el modelo. En última instancia, la gama de resultados está determinada por los patrones aprendidos por un modelo determinado a partir de los datos introducidos. Los datos con los que se entrena un modelo de IA determinan su eficacia, lo que subraya la dependencia de conjuntos de datos representativos, de alta calidad y precisos. Creemos que las empresas que aprovechen datos no estructurados obtendrán mayores eficacias y ofrecerán mejores resultados.
Almacenamiento
Una vez recopilados los datos, las opciones de almacenamiento van desde entornos de nube locales, públicos o privados, hasta soluciones híbridas. Cada opción tiene sus propias ventajas y limitaciones.
- El almacenamiento local ofrece autonomía y control sobre el hardware, un atributo que podría ser preferible cuando se manejan datos confidenciales o consideraciones normativas. Sin embargo, el almacenamiento local requiere una gran inversión de capital inicial y su escalabilidad es limitada.
- Los entornos en la nube proporcionan escalabilidad, accesibilidad y generalmente operan bajo una estructura de costes basada en el uso. Sin embargo, la dependencia de proveedores de servicios externos podría suscitar inquietudes relativas a la privacidad de los datos.
- Las soluciones híbridas combinan los beneficios tanto de los entornos locales como en la nube. Si bien un enfoque híbrido ofrece un alto grado de flexibilidad con respecto a la escala, el coste y la eficiencia, también requiere una integración compleja y conocimientos especializados.
En los últimos años, ha habido una gran migración a los entornos en la nube. Además del catalizador que fue la pandemia, el aumento de las cargas de trabajo de IA y de los servicios relacionados con la IA contribuirá al crecimiento y a los márgenes de la computación en la nube a partir de ahora. Esperamos que las empresas dentro del ecosistema de la nube se beneficien de esta coyuntura, incluidos los proveedores de infraestructura de red que facilitan la transición de plataformas locales a plataformas en la nube.
Fuente: Goldman Sachs Global Investment Research. A 18 de marzo de 2024. Se han encuestado a 100 ejecutivos de empresas de IT incluidas en la lista Global 2000. Pregunta: “¿Qué porcentaje de sus aplicaciones ya ha migrado a plataformas en la nube pública (p. ej., Amazon AWS, Microsoft Azure, Google Cloud) y qué porcentaje prevé dentro de 3 años?” Ninguna referencia a una empresa o valor específicos constituye una recomendación de compra, venta, mantenimiento o inversión directamente en la empresa o sus valores.
Depuración
Es esencial que las empresas confíen en los resultados generados por los modelos de IA. La previsibilidad del modelo, es decir, comprender el linaje y la precisión de los datos, es fundamental para ganarse la confianza de los usuarios y las partes interesadas. Esperamos que los responsables de la toma de decisiones corporativas utilicen la IA en asuntos importantes, desde ratings de crédito hasta decisiones sanitarias. Los escenarios de alto riesgo ponen de relieve la necesidad de disponer de datos de alta calidad dentro del contexto de los modelos de IA.
La introducción de datos no organizados e imprecisos en modelos de IA puede resultar cara y perjudicial para el rendimiento del modelo, ya que conllevan errores costosos y se debe dedicar tiempo a las correcciones. Los servicios de depuración de datos ayudan a mantener la integridad dentro de la cadena de valor de los datos y satisfacen los requisitos de trazabilidad del linaje de datos. Creemos que existe una oportunidad sustancial de invertir en empresas que ofrecen servicios de preparación y depuración de datos.
Protección
La protección de los datos para entrenar modelos de IA es primordial en un mundo en el que los métodos de ciberataque evolucionan constantemente a medida que los hackers encuentran y explotan nuevas vulnerabilidades. La mayor digitalización a nivel mundial y el complejo entorno geopolítico están propiciando el aumento del volumen y la sofisticación de los ciberataques. Las capacidades de avance de la IA también se pueden utilizar para desarrollar ciberataques y permitir filtraciones de datos, pero también serán un componente crítico de una defensa sólida, que posiblemente identifique la actividad oculta y los patrones complejos de comportamiento malicioso.
El panorama de amenazas evoluciona constantemente, por lo que los responsables de la toma de decisiones corporativas en torno a la seguridad de la información requerirán nuevas soluciones para proteger los datos confidenciales de su empresa. Los proveedores de ciberseguridad de última generación pueden ayudar a los clientes a proteger su activo más valioso. En los próximos años, esperamos que la innovación y la expansión del mercado creen oportunidades de inversión en tecnologías de ciberdefensa sólidas.
El Poder Está en los Datos
A medida que los modelos de IA se vuelven más sofisticados y complejos, el límite de una empresa dentro del contexto de las capacidades de GenAI estará determinado por la calidad de sus datos y la capacidad de gestionarlos de forma eficaz a lo largo de su ciclo de vida. Esto incluye el origen de los datos, la infraestructura de almacenamiento, los protocolos de depuración y las medidas para mantenerlos seguros.
Buscamos identificar empresas que ayuden a otras a gestionar sus datos eficaz y disciplinadamente en lugar de contaminar sus ecosistemas de IA con datos insuficientes o imprecisos. Como inversores activos, analizamos las posibles oportunidades de invertir en empresas que están aprovechando los datos para aumentar la eficiencia operativa, comprender mejor a sus clientes, crear experiencias más personalizadas y tomar decisiones más informadas, basadas en la aplicación de la IA. Creemos que estas empresas comenzarán a diferenciarse en 2024 y continuarán más adelante, a medida que las tecnologías de IA maduren y se amplíen las oportunidades de inversión.
1 McKinsey. El dividendo de los datos: fomento de la IA generativa. A 15 de septiembre de 2023.
2 IBM Institute for Business Value. Encuesta a CEO sobre la IA generativa. 200 CEO de EE. UU. A fecha de abril/mayo de 2023.