Retail traders no aprenden de sus pérdidas (Barber et al. 2019)¶

Hallazgo central de Barber et al. (2019): los resultados pasados no predicen el comportamiento futuro del retail day trader. Rentables y no-rentables siguen tradeando a tasas casi idénticas (96.4% vs 95.3%). El desempeño tiene "un efecto sorprendentemente pequeño" en la decisión de continuar.

El dato¶

Tipo de trader	Probabilidad de seguir tradeando al año siguiente
Rentable	96.4%
No rentable	95.3%
Diferencia	1.1 puntos porcentuales

La expectativa racional sería: los que pierden, paran. La realidad: casi nadie para por resultados.

Chague et al. (Brasil)¶

"Traders activos no mejoraron desempeño con el tiempo."

Tradeando más no mejora el skill. La curva de aprendizaje en day trading retail es plana — o negativa si se considera el burn-out.

Por qué sucede¶

Hipótesis documentadas en la literatura behavioral:

Overconfidence: atribuyen ganancias a skill y pérdidas a mala suerte / outliers. Nunca updatean prior.
Sunk cost fallacy: "ya invertí tanto esfuerzo/capital, no puedo parar ahora".
Gambler's fallacy + hot hand: piensan que la próxima va a ser la buena, o que están "en racha".
Selective recall: recuerdan ganancias vivas, pérdidas borrosas.
Attribution to external factors: el mercado fue raro, la economía, la noticia que nadie anticipó.
Social proof: otros traders en Twitter/Discord dicen estar ganando (selection bias en qué publican).
Entertainment: day trading como videojuego emocional; el "fun" no se mide en PnL.

Implicación crítica para el experimento¶

Si el user/agente hace day trading y pierde consistentemente, el sesgo humano natural es no parar. Para contrarrestar:

Kill switches objetivos (crítico)¶

Definir ex-ante condiciones de parada, en el CLAUDE.md del proyecto:

Drawdown: si el capital destinado al experimento cae > N% → pausar.
Sharpe negativo sostenido 6+ meses → revisar.
Peor que buy-and-hold SPY a 12 meses → revisar.
Peor que SPY a 24 meses → terminar el experimento.

Sin triggers ex-ante, el user/agente entra en la misma trampa que los 450,000 traders de Taiwan. El agente LLM puede codificar la disciplina que al humano le cuesta.

El agente NO es inmune¶

Un LLM puede: - Mantener el registro de PnL limpio (eliminar recall bias). - Aplicar guardrails binarios (eliminar discreción emocional). - Forzar parada en kill switches (eliminar sunk cost).

Pero también puede: - Aprender del user que quiere seguir y racionalizarlo. - Sobreajustar a períodos recientes (recency bias copiado del entrenamiento). - Fallar en catch black swans (tail risk management).

Relación con guardrails¶

Los guardrails del proyecto deben incluir:

Daily loss cap → automático.
Monthly drawdown cap → automático.
Experiment-level kill switch → automático.
El agente NO puede modificar estos sin aprobación humana explícita.

Relaciones¶

Evidence base: retail day trading evidence.
Base rates consecuencia: retail trader base rates.
Mitigación: trading guardrails (con kill switches duros).
Contrasta con el optimismo narrativo de: nate herk 24 7 trader.

Gaps¶

¿Hay estudios post-2019 con retail traders que usaron herramientas AI/algorítmicas — aprenden más rápido?
¿Qué kill switches usan los fondos institucionales y cómo se pueden adaptar a retail?
¿Hay un "momento" observable donde el rentable se separa del no-rentable? (skill emergence vs luck).