Vous êtes ici : Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

5 mars 2024

Segmentation of financial time series based on fuzzy Markov chain for asset picking and allocation


Catégorie : Doctorant


Subject : Segmentation of financial time series based on fuzzy Markov chain for asset picking and allocation

Supervisor: Abdeldjalil Aissa El Bey, J-M Le Caillec, Didier Guériot

eMail: abdeldjalil.aissaelbey@imt-atlantique.fr jm.lecaillec@imt-atlantique.fr

IMT Atlantique, Technopôle Brest-Iroise CS83818, 29238 Brest Cedex 3, France

 

Description

Les séries chronologiques financières, sous l’hypothèse d’efficience des marchés ou non, sont le reflet de plusieurs phénomènes difficiles à dissocier, voire à identifier. Les signaux physiques sont le produit d’interactions d’éléments physiques et leur comportement peut être décrit grâce à des équations différentielles par exemple. Ils peuvent donc être modélisés dans le cadre des probabilités et l’information portée par ces signaux est qualifiée d’incertaine. Si les séries chronologiques financières peuvent obéir à un certain formalisme mathématique, provenant de la théorie des jeux par exemple, elles comportent des biais cognitifs puisqu’elles sont le produit d’interactions entre humains (décisions contradictoires d’achat/vente). En particulier l’effet momentum, qui consiste à inclure dans son portefeuille les actifs qui ont surperformé par le passé, sans raison explicite sur la persistance de cette sur performance, est notamment pris en compte par certains indicateurs techniques (le Relative Strength Index par exemple). Le cas d’un bruit de marché/sectoriel, comme celui qui a impacté tous les constructeurs automobiles, lors du scandale Volkswagen, est un autre biais cognitif, négatif dans ce cas. Dans le cas de données (textuelles ou autres), comportant des interventions humaines, et notamment des biais cognitifs, on parlera d’information imprécise (par exemple y a-t-il une différence entre « c’est bon » et « ce n’est pas mauvais » ? [1]). Les séries financières comportent donc de l’information incertaine et possiblement de l’information imprécise. Le but de ce doctorat est de définir une méthode de segmentation des séries chronologiques financières qui puisse conjointement prendre en compte la nature incertaine et imprécise de ces séries chronologiques à des fins de choix de titres (asset picking) à mettre en portefeuille à partir d’un univers d’investissement prédéfini (action, fond, obligation, futurs, …). Cette méthode ne pourra être basée sur les probabilités (usuelles) et donc sur les algorithmes de segmentation de signaux, basés sur les probabilités (Expectation-Maximisation par exemple).

 

Application

La gestion de portefeuille, et plus particulièrement de choix des actifs à mettre dans ce portefeuille (stock /asset picking) est un sujet récurrent dans la théorie moderne du portefeuille (avec les problèmes de modélisation des actifs, contrats futurs, swap, taux et autres). Le choix des actifs est souvent traité séparément de l’allocation, qui consiste à évaluer le poids de ces actifs dans le portefeuille. L’allocation a fait l’objet d‘intenses recherches, alors que le choix d’actifs (picking) a été beaucoup moins abordé au cours des dernières décennies. Une des raisons est que le choix d’actifs nécessite de traiter un très grand nombre de données, en manipulant des critères moins bien définis que pour l’allocation (où le choix des actifs étant fait, les données intervenant dans l’optimisation sont moindres), avec des fonctions d’utilité bien établies. De plus, autant les critères de performance sont assez faciles à définir pour l’allocation (courbe Profit and Loss par exemple), ils le sont beaucoup moins pour le choix d’actifs (nécessité de « benchmarker » avec un portefeuille construit aléatoirement). Cette dissociation étant sous optimale, aujourd’hui on essaie de construire le portefeuille (choix/allocation) à partir des mêmes critères de performance.

Une approche pour la sélection d’actifs consiste à définir un état caché pour un actif (souvent une action ou un fond). Habituellement, on définit trois états possibles qui sont, la sous performance, la performance moyenne et la sur performance [6]. Ces trois états se dérivent bien entendu des rendements journaliers/mensuels observés et la performance se déduit par rapport à un indice ou une moyenne des rendements de l’univers d’investissement. Cette approche, bien que simple, permet de prendre en compte simplement le caractère non stationnaire des séries chronologiques financières mais aussi les biais cognitifs, car la surperformance peut traduire soit une vraie performance des actifs (par exemple une entreprise très innovante), soit l’effet momentum décrit plus haut. Cette approche reste rudimentaire et les travaux de recherches proposés ont pour but une meilleure prise en compte des biais cognitifs. L’hypothèse d’efficience des marchés voudrait que lorsqu’un actif soit sur/sous-évalué, il retourne rapidement dans l’état lui correspondant, mais comme nous l’avons dit les biais cognitifs font que ce n’est pas toujours vérifié. Le gestionnaire de portefeuille est bien entendu intéressé par anticiper les transitions d’un état vers un autre, passage vers un état supérieur pour la mise en portefeuille ou inférieur pour la sortie (et éventuellement de la vente à découvert). Ces possibles transition doivent donner lieu aux trois actions suivantes Sell/Hold/Buy qui sont basées sur l’estimation des probabilités des transition à vernir. Dans un cas où l’information est complétement exprimée dans le cadre des probabilités, l’outil mathématique idéal est bien entendu les chaînes de Markov cachées (pour modéliser les états). En effet, grâce à ces chaînes des Markov,une sélection et une allocation peuvent être basées sur les rendements espérés à l’horizon de re balancement grâce aux probabilités de transitions estimées par un algorithme, comme le Stochastic Expectation-Maximisation par exemple [6]. L’utilisation de mélanges de gaussiennes dans ces modèles permet de prendre en compte le caractère leptokurtique des rendements (c’est-à-dire non gaussien). Mais comme nous l’avons dit cette approche est limitée car si elle peut prendre en compte les biais cognitifs pour définir l’état de l’actif, ces biais ne peuvent pas être modélisés par les probabilités de transition.

Le but de ce doctorat est d’étudier la possibilité d’améliorer cette approche afin de tenir compte de ces biais cognitifs dans les transitions.

Comme cela a été dit dans l’introduction de trois pistes de recherche pour la prise en compte du caractère imprécis de l’information

1)Possibilité. La théorie des possibilités est une des approches développées depuis 50 ans pour prendre en compte et manipuler l ’information imprécise [1] pour la fusion d’information notamment. Les possibilités ont été un champ actif pour l’analyse et la manipulation des données financières, notamment pour la prise en compte de leur nature imprécise (voir le special issue sur la finance et gestion de portefeuille [7]). Cependant, même s’il est possible de définir des possibilités Bayésiennes (à l’instar des probabilités), les relations sur les possibilités Bayésiennes ne sont pas identiques à celles des probabilités (règles de Bayes). En particulier les équations de Chapman-Kolmogorov, qui sont la base de l’écriture matricielle des chaînes de Markov, ne sont pas vérifiées. Ceci implique que les inégalités, et donc les conditions de convergence des algorithmes de segmentation, basées sur ce formalisme matriciel, ne sont plus valides. De plus, estimer des possibilités à partir de données reste toujours une question ouverte (même en en utilisant la transformation de Dubois-Prade, qui supposent des distribution monomodales) surtout si la loi supposée des rendements est complexe (notre cas avec skewness/kurtosis) et éventuellement multimodale,. Un algorithme de segmentation à partir des possibilités est donc à définir. Il nécessitera une étape d’estimation des possibilités à partir des données.

2)Les probabilités et chaînes de Markov floue. Afin de préserver le formalisme des probabilités, tout en tenant compte du caractère imprécis des données, une idée a été de définir les probabilités floues, ce qui évite de passer par le formalisme des possibilités. Cela permet en particulier de conserver le formalisme matriciel et donc d’assurer les convergences des algorithmes de segmentation, comme cela a été dit dans le point précédent. La difficulté de cette approche est d’inclure et d’estimer le caractère imprécis de ces probabilités. Il peut être soit fixé, a priori, par un opérateur, soit estimé a posteriori c’est-à-dire dérivé des données. L’un des buts de cette piste consistera donc à estimer les probabilités de transition en ajoutant un flou sur les probabilités de transition à partir de méthodes statistiques de décision basée sur les possibilités [4] puis en ramenant à des méthodes de segmentations usuelles [6].

3)LSTM et autres réseaux de convolution flous

L’application des Long Short Term Memory à la finance n’a pas donné les résultats escomptés malgré la capacité de ces réseaux à produire de bonnes prédictions pour des séries chronologiques, possiblement non stationnaires. Deux raisons expliquent cette mauvaise performance. La première est sans doute d’être trop exigeant avec ce type de réseaux et vouloir qu’ils puissent prédire rendement à l’horizon de rebalancement. Seule des tendances sont susceptibles d’être extraites, mais pas l’évolution exacte des rendements. Cependant l’extraction de ces tendances pourrait être utile au choix des actifs après une phase de post traitement des prédictions de ces LSTM. La seconde raison est la nature déterministe des réseaux de neurones (pour la même entrée, on obtient la même sortie), qui en peut prendre en compte le caractère imprécis de l’entrée. La construction de réseaux de neurones flous [5] pourrait permettre de mieux s’adapter au caractère imprécis des séries financières. En particulier, ces réseaux de neurones intègrent des étapes de prédiction floue dans la couche de renforcement de la mémoire (Wang-Mendel), ce qui augmente leur capacité d’interprétabilité et de d’explicabilité, contrainte incontournable pour la gestion de portefeuille

Bien entendu ces trois pistes ne seront pas nécessairement traitées dans le doctorat, mais possiblement une ou deux de ces approches à titre de comparaison et possiblement de fusion des résultats.

 

Plan de thèse

6 mois: Bibliographie sur les différentes approches ainsi que sur les biais cognitifs en finance, et leur possible modélisation mathématique.

6 mois : Premiers résultats sur les 3 pistes proposées, discussion sur les verrous technologiques évoqués ci-dessus à faire résoudre

12 mois: Développement de la ou des méthodes choisies.

6 mois: Fusion des résultats et application au base de données ouvertes ?

6 mois : Ecriture du manuscrit

 

References

[1] Henri Prade and Didier Dubois, « Possibility Theory », in Computational Complexity, Springer, New York, NY, 2

[2] Fuzzy probabilitiées JJ Buckley Springer 2005

[3] J-M Le Caillec A Itani, D Gueriot, Y Rakotodratsimba “Stock Picking by Probability Possibility Approaches” ” IEEE Transactions on Fuzzy Systems, Vol 25, no 2, april 2017, pp 333- 349.

[4] Fuzzy statistical decision-making Theory and application C Kahraman et O Kabak Springer

[5] Wang, W., Shao, J. & Jumahong, H. Fuzzy inference-based LSTM for long-term time series prediction. Sci Rep 13, 20359

[6] J-M Le Caillec, “Asset Picking Based on a Markov Chain Modeling the Asset PerformanceIEEE Transactions Computational Intelligence vol 6 N° 1 pp 220-221 february 2022

[7] IEEE Transactions on Fuzzy Systems, Vol 25, Issue 2 • April-2017

 

Dans cette rubrique

(c) GdR IASIS - CNRS - 2024.