Universitat Autònoma de Barcelona. Programa de Doctorat en Matemàtiques
En la presa de decisions perceptives, la informació sensorial s'acumula al llarg del temps per arribar a una decisió categòrica. Aquest procés d'acumulació pot seguir diferents estratègies, on certs moments de l'estímul tenen més pes en la decisió que d'altres. Aquestes estratègies de ponderació temporal s'han relacionat amb diversos mecanismes subjacents, com l'acumulació limitada, que prioritza la informació primerenca de l'estímul (ponderació per primacia); la integració perfecta, que tracta tota la informació de manera uniforme (ponderació uniforme); i la integració amb fuites, que afavoreix la part final de l'estímul (ponderació per recència). A més, l'evidència experimental suggereix que tant els primats com els humans poden ajustar dinàmicament la seva estratègia de ponderació temporal en funció de les estadístiques de l'estímul, prioritzant la informació més primerenca o tardana segons el que requereixi la tasca. No obstant això, els mecanismes proposats no expliquen aquesta flexibilitat, ja que cap pot generar tota la diversitat dels patrons de ponderació temporal observats experimentalment. En aquesta tesi, combinem l'anàlisi de dades, el modelatge computacional i les xarxes neuronals recurrents per desenvolupar un marc integral que proposa un sol mecanisme capaç de capturar tota la flexibilitat en els patrons de ponderació temporal, caracteritzar els correlats conductuals i neuronals d'aquesta flexibilitat, i examinar l'optimalitat d'aquests patrons. En primer lloc, presentem evidència experimental sobre com la flexibilitat en la ponderació temporal es reflecteix en el comportament d'humans i macacos. Vam trobar que aquesta flexibilitat s'adquireix mitjançant l'exposició a les estadístiques de l'estímul, sent l'estat de vigília previ a la presentació de l'estímul un factor determinant per un bon rendiment en la tasca. A més, vam analitzar enregistraments de la cortesa temporal mitjana (MT) de macacos i vam descobrir que, tot i que la taxa mitjana de disparo neuronal roman constant malgrat els canvis en les estadístiques de l'estímul, l'activitat relacionada amb l'estímul i amb l'elecció depèn de les estadístiques de manera no trivial. En segon lloc, vam desenvolupar un model de taxa de disparo en dues àrees, compost per un circuit sensorial i un circuit de decisió, connectats per senyals de baix a dalt i de dalt a baix, amb una senyal de modulació que controla la dinàmica d'atractor del circuit de decisió. Aquest model replica amb èxit la flexibilitat observada experimentalment en la ponderació temporal. Mecanísticament, la senyal de modulació inicia el procés de presa de decisions empentant la xarxa cap a un règim competitiu, i modula la dinàmica de la decisió accelerant o retardant l'elecció, de forma similar a una senyal d'urgència. En controlar la integració de l'evidència i alterar la forma o durada de la senyal, vam ser capaços de generar una gamma més àmplia de patrons de ponderació temporal, més enllà del que es va observar experimentalment. En tercer lloc, utilitzem Xarxes Neuronals Recurrents (RNN) per explorar si els patrons observats en les dades experimentals són òptims. Les estratègies de ponderació no uniformes emergeixen com adaptacions òptimes al soroll intern quan les RNN es especialitzen en una sola condició de l'estímul. Quan vam entrenar una RNN en una configuració seqüencial similar a la dels macacos, va adoptar una estratègia rígida de ponderació temporal sesgada cap a la condició inicial, sense adaptar-se a noves demandes. Per superar aquesta limitació, vam introduir senyals contextuales que representaven les condicions de la tasca, permetent entrenar totes les condicions en una sola RNN. Aquest enfocament va permetre que la RNN mostrés flexibilitat comparable a les xarxes entrenades independentment, aprengués més ràpid i generalitzés a noves tasques. Aquests resultats suggereixen que les senyals contextuales podrien ser el mecanisme subjacent al canvi de context observat en les dades experimentals.
En la toma de decisiones perceptivas, la información sensorial se acumula con el tiempo para alcanzar una decisión categórica. Este proceso de acumulación puede seguir diferentes estrategias, en las cuales ciertos momentos del estímulo tienen más peso en la decisión que otros. Estas estrategias de ponderación temporal se han relacionado con diversos mecanismos subyacentes, como la acumulación limitada, que prioriza la información temprana del estímulo (ponderación por primacía); la integración perfecta, que trata toda la información de manera uniforme (ponderación uniforme); y la integración con fugas, que favorece la parte final del estímulo (ponderación por recencia). Además, investigaciones experimentales sugieren que tanto primates como humanos pueden ajustar dinámicamente su estrategia de ponderación temporal en función de las estadísticas del estímulo, priorizando la información más temprana o tardía según lo requiera la tarea. Sin embargo, los mecanismos actuales no explican completamente esta flexibilidad, ya que ninguno puede generar la diversidad de patrones de ponderación temporal observados experimentalmente. En esta tesis, combinamos análisis de datos, modelado computacional y redes neuronales recurrentes para desarrollar un marco integral que propone un único mecanismo capaz de captar toda la flexibilidad en los patrones de ponderación temporal, caracterizar sus correlatos conductuales y neuronales, y examinar la optimalidad de estos patrones. En primer lugar, presentamos evidencia experimental sobre cómo la flexibilidad en la ponderación temporal se refleja en el comportamiento de humanos y macacos. Encontramos que esta flexibilidad se adquiere mediante la exposición a las estadísticas del estímulo, siendo el estado de vigilia previo a la presentación del estímulo un factor determinante para un buen desempeño en la tarea. Además, analizamos grabaciones de la corteza temporal media (MT) de macacos y descubrimos que, aunque la tasa promedio de disparo neuronal permanece constante a pesar de los cambios en las estadísticas del estímulo, la actividad relacionada con el estímulo y con la elección depende de las estadísticas de una manera no trivial. En segundo lugar, desarrollamos un modelo de tasa de disparo en dos áreas, compuesto por un circuito sensorial y uno de decisión, conectados mediante señales de abajo hacia arriba y de arriba hacia abajo, con una señal de modulación que controla la dinámica de atractor del circuito de decisión. Este modelo reproduce exitosamente la flexibilidad observada experimentalmente en la ponderación temporal. Mecanísticamente, la señal de modulación inicia el proceso de toma de decisiones al empujar la red hacia un régimen competitivo, y modula la dinámica de la decisión acelerando o retrasando la elección, de forma similar a una señal de urgencia. Al controlar la integración de la evidencia y alterar la forma o duración de la señal, pudimos generar una gama más amplia de patrones de ponderación temporal, más allá de lo observado experimentalmente. En tercer lugar, utilizamos redes neuronales recurrentes (RNN) para explorar si los patrones observados en los datos experimentales son óptimos. Las estrategias de ponderación no uniformes emergen como adaptaciones óptimas al ruido interno cuando las RNN se especializan en una sola condición de estímulo. Cuando entrenamos una RNN en una configuración secuencial similar a la de los macacos, adoptó una estrategia rígida de ponderación temporal sesgada hacia la condición inicial, sin adaptarse a nuevas demandas. Para superar esta limitación, introdujimos señales contextuales que representaban las condiciones de la tarea, permitiendo entrenar todas las condiciones en una sola RNN. Este enfoque permitió que la RNN mostrara flexibilidad comparable a las redes entrenadas independientemente (alineando la ponderación temporal con las estadísticas del estímulo), aprendiera más rápido y generalizara a nuevas tareas. Estos hallazgos sugieren que las señales contextuales podrían ser el mecanismo subyacente al cambio de contexto observado en los datos experimentales.
In perceptual decision-making, sensory information is accumulated over time to reach a categorical decision. This accumulation process can follow different strategies, where certain moments of the stimulus are weighted more heavily in the decision than others. Such temporal weighting strategies have been linked to various underlying mechanisms, including bounded accumulation, which prioritizes early stimulus information (primacy weighting); perfect integration, which treats all stimulus information uniformly (uniform weighting); and leaky integration, which favors only the later part of the stimulus (recency weighting). Moreover, experimental evidence suggests that both primates and humans can dynamically adjust their temporal weighting strategy in response to stimulus statistics, prioritizing later or early stimulus information as the task requires. Nevertheless, the proposed mechanisms fall short in explaining this flexibility, as none can generate the full diversity of experimentally observed temporal weighting patterns. In this thesis, we combine data analysis, computational modeling, and recurrent neural networks to develop a comprehensive framework that proposes one single mechanism that can capture the full range of flexibility in the temporal weighting patterns, characterize the behavioral and neural correlates of this flexibility, and examine the optimality of these patterns. First, we present experimental evidence of how temporal weighting flexibility is represented in the behavior of both humans and macaques. We found that this flexibility is acquired through exposure to the stimulus statistics with the state of vigilance previous to the presentation of the stimulus having a significant impact on effectively performing the task. Additionally, we analyzed middle temporal (MT) recordings from behaving macaques and found that, while the average firing rate of the neural population remains stable despite changes in stimulus statistics, stimulus-related and choice-related activity depend on the stimulus statistics in a non-trivial way. Second, we developed a two-area firing rate model consisting of a sensory circuit and a decision circuit, connected by bottom up and top down, with a modulation signal that controls the attractor dynamics of the decision circuit. This model successfully replicates the experimentally observed flexibility in temporal weighting. Mechanistically, the modulation signal initiates the decision-making process by pushing the network into a competitive regime and modulates the decision dynamics by either accelerating or delaying the choice, similar to an urgency signal. By controlling the initiation of evidence integration and altering the signal's shape and/or duration, we were able to generate a broader range of temporal weighting patterns, extending beyond what was observed experimentally. Third, we use Recurrent Neural Networks (RNNs) to explore whether the temporal weighting patterns observed in experimental evidence are optimal. Non-uniform weighting strategies emerge as optimal adaptations to internal noise when RNNs specialize in a single stimulus condition. These patterns are robust across networks, with task-specific low- or high-dimensional dynamics. When trained in a sequential setup similar to the macaques, the RNN adopted a rigid temporal weighting strategy biased towards the initial training condition, failing to adapt to new task demands. To overcome this limitation, we introducing contextual signals representing the task conditions which allowed simultaneous training across all conditions in a single RNN. This approach allowed the RNN to exhibit flexibility comparable to independently trained networks (aligning temporal weighting with stimulus statistics), faster learning, and generalization to novel tasks. These findings suggest that contextual signals may be the mechanism underlying the context switching observed in experimental data.
Ponderació temporal flexible; Ponderación temporal flexible; Flexible temporal weighting
51 - Mathematics
Ciències Humanes