Robeco, The Investments Engineers
blue circle

01-03-2023 · Entrevista

«Los modelos de machine learning pueden identificar interacciones interesantes»

Palabras de moda como «datos alternativos», «machine learning» y «procesamiento del lenguaje natural» están cada vez más presentes en las conversaciones de los gestores de carteras. En una charla con el analista cuantitativo Clint Howard, revelamos lo que significan estos términos para el equipo de inversión cuantitativa de Robeco.

    Autores/Autoras

  • Lusanele Magwa - Investment Specialist

    Lusanele Magwa

    Investment Specialist

La creciente relevancia de los big data está ampliando el alcance de las estrategias cuantitativas. Entonces, dada la multitud de nuevos conjuntos de datos alternativos que están surgiendo, ¿cómo seleccionar cuáles utilizar?

«Nuestras iniciativas de análisis se basan en ideas sustentadas en mecanismos económicos fundamentales. Como inversores cuantitativos, tradicionalmente nos hemos apoyado en los datos de los estados financieros y del mercado para llevar a cabo estos análisis. Ahora, con la avalancha de conjuntos de datos alternativos, disponemos de información adicional y de formas diferentes para examinar nuestras ideas. Dicho esto, es importante discernir qué conjuntos de datos pueden aportar valor».

«Nos centramos intencionadamente en los fundamentos económicos de nuestras ideas antes de seleccionar las fuentes de datos (ya sean alternativas o tradicionales). Esto nos permite ser bastante prudentes a la hora de elegir los conjuntos de datos que creemos que responderán realmente a las cuestiones que estamos analizando. Si no se parte de los principios económicos, se corre el riesgo de ajustar en exceso un modelo y debilitar su poder predictivo, ya que podrían elegirse conjuntos de datos inadecuados».

«Por ejemplo, los datos de textos como informes de agentes de bolsa, anuncios de empresas y archivos de noticias son valiosos, porque contienen grandes volúmenes de datos. Pero estas fuentes de datos solo aportan valor a nuestro proceso si podemos utilizarlas para analizar la intuición económica que subyace a nuestras observaciones o hipótesis sobre el mercado. Por tanto, los conjuntos de datos alternativos son un medio para alcanzar un fin, pero no lo único y definitivo».

Los proveedores de datos pueden ofrecer los mismos conjuntos de datos a gestores de carteras de la competencia. Entonces, ¿cómo obtiene información única el equipo de inversión cuantitativa de Robeco?

«Es cierto, los proveedores de datos comercializan y venden sus conjuntos de datos a diversos gestores de carteras, ya que es la naturaleza de su negocio. Por eso, si los inversores se limitan a introducir los datos en sus modelos o estrategias tal como los reciben, corren el riesgo de perder precisión y caer en la generalización, ya que es fácil que sus homólogos estén haciendo lo mismo».

«Hay varias formas de abordar esto. En nuestro caso, preferimos adquirir conjuntos de datos con el mínimo tratamiento posible, en los que el proveedor haya efectuado las mínimas alteraciones. Esto nos permite transformar los datos desagregados para adecuarlos a los problemas económicos que tratamos de analizar. De esta manera, podemos incorporar nuestra visión única y nuestros conocimientos sobre la materia, diferenciando así nuestro uso de los datos frente a la competencia».

«Es importante recalcar que siempre iniciamos nuestros análisis basándonos en la intuición sobre la economía. Esto significa que tenemos una idea razonable de por qué algo puede funcionar. Solo entonces buscamos los conjuntos de datos que podemos utilizar para validar o refutar nuestra intuición. Siguiendo este planteamiento, creemos que disminuye la posibilidad de utilizar un conjunto de datos de manera exactamente igual que otro gestor de carteras».

¿Qué podemos hacer hoy con el machine learning (ML) que no fuese fácil antes?

«Durante décadas, los modelos lineales estándar han sido el método elegido en los modelos cuantitativos y han sentado las bases del éxito alcanzado por este estilo de inversión a lo largo de los años. Básicamente, estos modelos imponen relaciones lineales entre variables, a partir de las cuales pueden deducirse patrones, por ejemplo, para establecer señales de alfa, modelos de riesgo o algoritmos de construcción de carteras».

«El machine learning proporciona a los inversores cuantitativos un conjunto de herramientas adicional para estudiar los problemas de la economía (o para descubrir esos patrones). Este marco tan flexible y poderoso (mediante el uso de aplicaciones como las redes neuronales y el bosque aleatorio) puede poner de manifiesto relaciones no lineales entre variables, así como la manera de interaccionar unas variables con otras. Así, los inversores cuantitativos pueden obtener más información útil para la creación de señales».

«Por ejemplo, los modelos ML pueden detectar interacciones interesantes, como entre el flujo de noticias y la reversión en el precio de las acciones. Uno de los patrones observados en los mercados es que cuando el precio de las acciones de una empresa sube (o baja) por un gran margen, luego tiende a volver a bajar (o subir). Curiosamente, descubrimos que este fenómeno de reversión se ve afectado por el nivel de flujo anómalo de noticias relacionadas con las acciones en cuestión».

«Concretamente, si ha habido un flujo de noticias especialmente abundante sobre un valor en un momento en que su cotización está subiendo o bajando con fuerza, éste no tiende a revertir. La intuición nos dice que probablemente hay una reacción genuina a un cambio en los parámetros fundamentales si ha habido muchas noticias sobre un acontecimiento reciente. Pero, en ausencia de un flujo significativo de noticias, tendemos a ver el patrón de reversión en las acciones, lo que sugiere que el movimiento inicial probablemente se basó en el ruido más que en los fundamentos. Así que, este tipo de análisis nos parece muy interesante».

¿Y por qué ahora?

«El machine learning, concretamente las redes neuronales, se están estudiando desde los años 40, pero hay dos motivos principales por los que estos conceptos no han despegado hasta hace poco. El primer motivo es la capacidad de los ordenadores. Para ponerlo en contexto, en aquellos tiempos, habría llevado varios meses ejecutar el modelo ML más sencillo en el ordenador de IBM o Bell Labs más moderno de la época. El punto de inflexión llegó con el nuevo milenio, cuando experimentamos un crecimiento exponencial de la capacidad de los ordenadores. Esto facilitó el auge de la investigación aplicada en el campo del machine learning para resolver problemas del mundo real».

«El segundo motivo está relacionado con los datos, ya que los modelos ML requieren una cantidad enorme para su entrenamiento. La llegada de los big data y la mayor facilidad de acceso (en gran parte gracias a la informática en la nube) han sido muy útiles. Hoy en día, podemos encontrar datos prácticamente sobre cualquier cosa y esto ha impulsado la investigación sobre las aplicaciones de ML, dado el aumento de las posibilidades de formación. Por suerte para quienes nos dedicamos a las finanzas, también nos beneficiamos del trabajo inicial de investigación aplicada en el campo del machine learning realizado por los informáticos».

Manténgase al día de las últimas perspectivas con actualizaciones mensuales por correo

Reciba nuestro boletín de Robeco y sea el primero en leer las últimas novedades y construir la cartera más ecológica.

Manténgase al día

¿Qué opina del concepto de que los modelos ML son como cajas negras?

«Si me lo hubiese preguntado hace cinco o diez años, le habría dicho que es una definición adecuada porque, por aquel entonces, había mucho entusiasmo en vista de los resultados que se estaban obteniendo con las técnicas de machine learning. Pero no se prestaba mucha atención a lo que se escondía bajo la superficie. Desde entonces, ha habido avances significativos en este frente, como el desarrollo de las herramientas XAI (Explainable AI), que permiten a los usuarios entender mejor las predicciones de los modelos ML».

«Por ejemplo, el valor de Shapley es un método XAI que nos permite interpretar modelos ML analizando la relación entre las entradas y las salidas del modelo, cómo contribuyen las distintas variables a la predicción de resultados, cómo se interrelacionan las variables, etc. Este nivel de comprensión es acorde con nuestra filosofía de inversión, según la cual, todas nuestras ideas tienen que estar fundamentadas en una lógica económica. Estas herramientas nos permiten ver si los modelos ML toman decisiones acordes con nuestra intuición sobre la economía».

«Dicho esto, el listón para que utilicemos modelos ML en nuestras estrategias es alto debido a su naturaleza compleja. Tenemos que estar seguros de que entendemos cómo funcionan, de que se comportan de la forma que esperamos y de que aportan más valor a nuestros modelos actuales. Sin estas herramientas XAI que transforman los modelos ML en “cajas de cristal”, probablemente no podríamos explorar las posibilidades que ofrece el machine learning».

El procesamiento del lenguaje natural (NLP) está llamando mucho la atención en los últimos años. ¿Nos puede hablar de algunas aplicaciones interesantes del NLP?

«El NLP es un conjunto de recursos útiles para analizar palabras y textos hablados. A los inversores cuantitativos nos entusiasma este concepto porque nos permite adentrarnos en terrenos hasta ahora desconocidos. Para ponerlo en contexto, los analistas de renta variable basados en el análisis fundamental examinan las notas de investigación de los agentes de bolsa, analizan los informes de las empresas, revisan los comunicados de prensa y se reúnen con los equipos directivos, entre otras cosas. Gracias a su experiencia, extraen conclusiones leyendo entre líneas. Ahora, los inversores cuantitativos pueden realizar tareas similares con técnicas de NLP, como analizar el clima de opinión».

«Por ejemplo, esto nos permite examinar la opinión que tienen de una empresa los agentes de bolsa en función de cómo escriben sobre ella en sus informes, nos permite analizar el tono de las noticias en función del lenguaje utilizado en los artículos relativos a empresas concretas y nos proporciona herramientas para evaluar el estado de ánimo dentro de una empresa en función del lenguaje utilizado por sus ejecutivos en las ruedas de prensa en comparación con los anuncios de resultados. Además, se puede hacer rápidamente para miles de acciones. Y esta es solo una de las múltiples maneras en la que puede utilizarse el NLP en los modelos cuantitativos».

¿Y si los directivos de una empresa adaptan su manera de hablar para evitar esto?

«Es la clásica teoría de juegos. En este escenario, los inversores cuantitativos empiezan construyendo modelos de NLP para analizar el lenguaje empleado por los directivos. Cuando los directivos se dan cuenta, cambian su estilo de comunicación para disimular sus sentimientos. Pero todo acaba cerrándose como un círculo, ya que los inversores cuantitativos pueden volver a entrenar a sus modelos de NLP para que detecten los cambios, hasta que los directivos hagan nuevos ajustes en la forma de transmitir sus mensajes».

«Este bucle iterativo responde al concepto de: si quieres innovar, tienes que innovar constantemente. No solo nuestros competidores intentarán seguirnos el ritmo o adelantarse, sino también las empresas en las que invertimos. Esto significa que tenemos que actualizar y mejorar continuamente nuestra forma de analizar y de aplicar nuestras estrategias».