Por qué la mayoría de los resultados de las investigaciones sobre Psi son falsos (1)

Por qué la mayoría de los resultados de las investigaciones sobre Psi son falsos: la crisis de replicabilidad, la paradoja de Psi y el mito de Sísifo

Front. Psychol., 18 de septiembre de 2020 | https://doi.org/10.3389/fpsyg.2020.562992

Thomas Rabeyron1,2 *

1Université de Lorraine, Interpsy, Nancy, Francia

2Universidad de Edimburgo, KPU, Edimburgo, Reino Unido

La crisis de replicabilidad en psicología ha sido influenciada por los resultados de nueve experimentos realizados por Bem (2011) y presentados como apoyo a la existencia de la precognición. En este artículo, esperamos mostrar cómo el debate sobre estos experimentos podría ser una oportunidad para desarrollar un pensamiento original sobre psicología y replicabilidad. Después de algunas observaciones preliminares sobre psi y epistemología científica, examinamos cómo los resultados de psi conducen a una paradoja que cuestiona cuán apropiado es el método científico para la investigación de psi. Esta paradoja pone de relieve un problema en la forma en que se llevan a cabo los experimentos en la investigación psi y su posible consecuencia en la investigación general en psicología. A continuación, se analizan dos experimentos clásicos, el protocolo Ganzfeld y los estudios Bem, para ilustrar esta paradoja y sus consecuencias. La investigación convencional también se aborda en el contexto más amplio de la crisis de replicación, el efecto de declive y las prácticas de investigación cuestionables. En conclusión, se proponen varias perspectivas para la investigación futura y subrayan el valor heurístico de los estudios psi para la psicología.

Crisis de replicabilidad e investigación psi

La crisis de replicabilidad ha sido ilustrada por los resultados de nueve experimentos realizados por Bem (2011) y reportados en el Journal of Personality and Social Psychology que apoyan la existencia de la precognición. Como explica Romero (2019) “aunque el hallazgo persuadió a muy pocos científicos, la controversia generó desconfianza en las formas en que los psicólogos realizan sus experimentos porque Bem utilizó procedimientos y herramientas estadísticas que utilizan muchos psicólogos sociales” (p. 3). De hecho, si Bem pudo demostrar la existencia de la precognición, y dado que la precognición no puede existir para muchos psicólogos (Reber and Alcock, 2020), ¿demostró inconscientemente que algo andaba profundamente mal en la forma en que se llevan a cabo los experimentos en el campo de la psicología (Wiggins and Chrisopherson, 2019)? Se han publicado muchos artículos relevantes desde la publicación inicial de Bem (Pashler and Harris, 2012; Savalei and Dunn, 2015) sobre la crisis de la replicabilidad, las estadísticas bayesianas (Witte and Zenker, 2017) y las prácticas de investigación cuestionables (QRP; Wagenmakers et al., 2011; Bierman et al., 2016). En el presente artículo, nos gustaría sugerir que este debate podría ser una oportunidad para desarrollar un pensamiento original sobre psicología y replicabilidad. En este sentido, mostraremos que los estudios de Bem no son un “accidente” aislado, sino que están insertados en una larga tradición de investigación que trata de abordar problemas epistemológicos complejos sobre la naturaleza de la realidad y la conciencia humana. Específicamente, argumentaremos que las controversias sobre la existencia de psi podrían ser muy informativas sobre los estudios de psicología y conciencia.

La investigación psi puede considerarse como un subcampo de los estudios de conciencia que se ocupan de las interacciones entre los individuos y su entorno que trasciende las limitaciones ordinarias del espacio-tiempo (Bem and Honorton, 1994; Radin, 2006; Irwin and Watt, 2007; Cardeña, 2018). Desde hace más de un siglo se han desarrollado diferentes líneas de investigación para abordar la psi utilizando investigación experimental (Rhine et al., 1966), casos espontáneos (Rhine-Feather and Schmicker, 2005), casos clínicos (Rabeyron, 2020), participantes seleccionados[1] (Méheust, 1999; Braude, 2007) y aplicaciones (Schwartz, 2001, 2007; May et al., 2018). Varios metanálisis de estudios realizados en condiciones controladas examinan los sueños precognitivos (es = 0,14; Sherwood and Roe, 2003), la telepatía (es = 0,14; Storm et al., 2010) y el presentimiento (es = 0,21; Mossbridge et al., 2012) y han demostrado efectos estadísticamente significativos. La investigación de Bem (2011) sobre precognición[2] publicada en el JPSP no es, por tanto, aislada. Puede considerarse como la lógica de la evolución de la investigación psi previa.

Si bien estos resultados apoyan la existencia de una experiencia/comportamiento anómalo consistente que ha sido etiquetado como “psi”, actualmente no hay consenso en la comunidad científica con respecto a su interpretación y hasta ahora han surgido dos posiciones principales. Los “escépticos” suponen que son consecuencia de errores, sesgos y diferentes formas de QRP (Alcock, 2003; Alcock et al., 2003; Hyman, 2010; Wiseman, 2010; Wagenmakers et al., 2011; Reber and Alcock, 2020). Los “proponentes” argumentan que estos resultados prueban la existencia de psi más allá de toda duda razonable y que las nuevas investigaciones deberían pasar al análisis de los procesos psi en lugar de más intentos de probar su existencia (Radin, 2006; Cardeña et al., 2015; Cardeña, 2018). Esta ausencia de consenso está relacionada con la dificultad de sacar conclusiones firmes de los resultados de la investigación psi. De hecho, representan una anomalía (Rao and Palmer, 1987) porque actualmente no existe un modelo científico, basado en principios físicos o biológicos, que explique tales interacciones, incluso si existen (Kuhn, 1962)[3]. Sin embargo, sea cual sea la explicación correcta, los resultados de la investigación psi pueden ser informativos para las ciencias psicológicas más amplias (Schooler et al., 2018). De hecho, conducen a dos hipótesis opuestas pero muy heurísticas: (a) dentro de este campo de investigación, que ha sido realizado por cientos de investigadores cuyos esfuerzos críticos abarcan más de un siglo, los investigadores han sido fraudulentos o han sido engañados, incluso cuando utilizando las herramientas más fiables de la investigación científica y (b) psi existe y la conciencia humana puede interactuar con su entorno más allá de los límites habituales del espacio y el tiempo. Este artículo explorará estas dos hipótesis y sus consecuencias para la investigación psi y la psicología en general.

¿Y si… Psi realmente existe? La paradoja psi

La historia de la ciencia ha mostrado muchos ejemplos de fenómenos que fueron observados de manera confiable pero que fueron rechazados por la comunidad científica porque no eran explicables en el momento de su observación (por ejemplo, meteoritos, latidos del corazón, etc.). En consecuencia, sería prudente tener cuidado al considerar resultados anómalos de la variedad psi, especialmente sabiendo que 22 ganadores del Premio Nobel, científicos destacados y figuras de la vida intelectual han informado sobre tales experiencias y se posicionaron a favor de su existencia (Méheust, 1999)[4]. Por tanto, si suponemos, al menos por un momento, que existen elementos suficientes para tomar en serio la hipótesis de que la opción (b) es verdadera, es decir, psi realmente existe, ¿cuáles son las consecuencias de tal suposición? ¿Podría dar sentido a otras observaciones en el campo de la psicología y otros dominios científicos? ¿Y cambia la forma en que se debe realizar la investigación científica?

Los estudios psi, vistos como un todo, sugieren que es posible una especie de interacción “directa” (consciente o inconsciente) entre los seres humanos individuales y su entorno. Esta interacción se refiere a eventos u objetos situados a distancia en el espacio y el tiempo (Mossbridge and Radin, 2018). Puede tomar muchas formas (instinto, comportamiento, representación mental, etc.) con diferentes intensidades (por ejemplo, una emoción pequeña o fuerte). Puede ser perceptivo (del entorno a la persona) o proyectivo (de la persona al entorno). Puede estar asociado a una transferencia de información o, más bien, a algo que parece una transferencia de información (Lucadou et al., 2007). Emerge más fácilmente durante estados alterados de conciencia (Storm et al., 2010), es más pronunciado para algunas personas (Schlitz and Honorton, 1992) y tiende a emerger durante o después de eventos traumáticos (Rabeyron and Loose, 2015). Esta interacción directa se asocia más generalmente con experiencias paranormales subjetivas (por ejemplo, experiencias cercanas a la muerte y experiencias extracorporales) incluso si no se superponen por completo (Rabeyron et al., 2018). Además, incluso si no se comprende bien el papel de la conciencia en los procesos psi, es probable que la atención (McMoneagle and May, 2014), la memoria (Carpenter, 2012), la creatividad (Holt, 2012), los rasgos de personalidad (Thalbourne, 2000) , la creencia (Lawrence, 1993) y los aspectos psicodinámicos (Rabeyron and Loose, 2015) son componentes de ella.

Estos resultados de la investigación psi construyen una paradoja específica que es el meollo del presente artículo. Esta paradoja llevaría a la conclusión de que la mayoría de los hallazgos de la investigación psi son falsos (o inapropiados), pero no por las razones que generalmente suponen los escépticos. En primer lugar, debemos recordar que la investigación científica se basa en el principio de que, en general, el investigador (el observador) está separado o es independiente de la variable dependiente. El investigador trata de no afectar el resultado de un experimento de modo que lo que se observa varía con la variable independiente que se está probando y es independiente de los pensamientos, intenciones, creencias o incredulidad del investigador. Se supone que esta suposición permite a otros científicos demostrar el mismo resultado en las mismas condiciones (o no, según sea el caso). Este es el marco lógico y epistemológico en el que suele realizarse la investigación científica. Este modelo funciona muy bien y ha producido mucho conocimiento científico y progreso tecnológico confiables. Incluso si esta es una visión simplista de la forma en que avanza la investigación científica, como lo muestra la epistemología de la ciencia (Feyerabend, 1975; Chalmers, 1979), tal representación de la investigación científica es, no obstante, un principio útil que guía a los científicos hacia las buenas prácticas.

Sin embargo, si es posible una interacción directa (en el sentido descrito anteriormente) entre una persona y su entorno, este principio también podría influir en el resultado de experimentos que pretendan utilizar los principios científicos, porque podría haber una interacción directa entre los científicos (el observador) y su objeto de estudio (lo observado). Por tanto, si existe psi, el problema es el siguiente: podría ser posible una interacción “directa”, advertida o inadvertida, entre el investigador y el objeto de estudio. Esto destruye las condiciones necesarias para la demostración científica convincente de la psi misma.

Esto conduce a las siguientes paradojas: (1) si la existencia de psi se prueba en un entorno científico clásico, entonces demuestra retroactivamente que este ajuste es inapropiado porque psi implica que no hay un “corte” claro entre el observador y lo observado. (2) Entonces, si esta suposición del entorno científico es inapropiada (debido a psi), entonces este ajuste no se puede utilizar para probar la existencia de psi. Pero, entonces, como no se puede probar psi, ¡el escenario científico en sí parece ser todavía apropiado! En consecuencia, podemos intentar usar el entorno científico para probar la existencia de psi, pero ahora estamos de nuevo en (1), lo que conduce a (2), y sigue lógicamente un bucle paradójico infinito entre (1) y (2) . Muestra de manera más general que el principio en el que se basa un experimento científico para estudiar psi, la separación ontológica entre el observador y lo observado, sería erróneo. En consecuencia, ningún conocimiento científico en este campo de investigación podría producirse tan pronto como no haya una distinción clara entre el observador y lo observado. De hecho, no hay forma de saber, por razones epistemológicas, si lo que se observa es un efecto inducido por el experimentador (debido a una posible influencia psi) o una característica del fenómeno independientemente del experimentador. La distinción entre expectativas y realidad no está clara, y el investigador psi que utiliza este enfoque solo puede convertirse en una versión moderna de Sísifo[5], como se mostrará más adelante.

Dos ejemplos de la literatura: el protocolo de Ganzfeld y los estudios de Bem

El experimento de Ganzfeld, el protocolo más clásico en la investigación psi (Bem and Honorton, 1994), proporciona un ejemplo interesante del razonamiento anterior. Durante este experimento, un participante (el receptor) está cómodamente sentado en una silla, con una máscara que le muestra un campo visual uniforme (generalmente rojo) mientras escucha un ruido blanco. El participante se encuentra inmerso en un campo sensorial constante y neutral que genera rápidamente un estado alterado de conciencia que se supone favorece las percepciones psi (Storm et al., 2010). Después de 20 min, el participante intenta encontrar, entre varias imágenes o videos (generalmente, el objetivo correcto y tres objetivos alternativos), el que fue “transmitido” telepáticamente por otro participante (el remitente) ubicado en otra habitación. Como muestra la literatura, se ha obtenido una tasa de éxito promedio del 33% en la elección del receptor en lugar del 25% solo por casualidad (Storm et al., 2010). Por tanto, se ha demostrado una correlación significativa entre las elecciones de los receptores y los objetivos mostrados a los remitentes. Pero, ¿qué más se ha aprendido? ¿Este experimento demuestra la existencia de la telepatía?

No, porque no se puede probar de manera definitiva. Se pueden proponer diferentes interpretaciones en competencia, pero no se pueden aislar ni confirmar. De hecho, no hay forma de proponer una afirmación falsable o establecer un experimento crucial (Popper, 1934). Por ejemplo, ¿es un efecto telepático (el remitente “envía” el objetivo y el receptor lo “recibe”) o un efecto precognitivo (el receptor realmente percibe al objetivo del “futuro” cuando se le presentan los cuatro objetivos posibles? al final de la sesión y se le pide que elija)? Para probar esta hipótesis, se puede configurar un experimento en el que se le da retroalimentación a la mitad de los receptores (ven el objetivo correcto después del estado de Ganzfeld) y no se le da retroalimentación a la mitad de los receptores (no ven el objetivo correcto y, en su lugar, un juez ciego evalúa la correlación entre las mentalidades del receptor y los cuatro posibles objetivos)[6]. Si suponemos que se obtiene un efecto significativo solo para los ensayos de retroalimentación, ¿prueba la hipótesis precognitiva? No es así, porque incluso si este experimento se repitió 50 veces con los mismos resultados y utilizando las mejores condiciones experimentales, no hay forma de saber si este efecto es una consecuencia de (1) un efecto precognitivo, (2) una influencia psi de los participantes, (3) un efecto psi del experimentador en la computadora que elige el objetivo, y (4) ¡muchas otras opciones! Porque tan pronto como no hay un límite claro entre el experimentador, el participante y la metodología, todo se vuelve posible.

Otra posibilidad es que algunos experimentadores puedan influir constantemente en los datos experimentales y, por lo tanto, obtengan resultados significativos. Esta variable en sí misma ha sido el foco de una considerable investigación (Broughton, 1979; Palmer, 1997; Parker and Miller, 2014)[7]. Se puede probar durante un experimento de Ganzfeld trabajando con 10 experimentadores diferentes y comparando sus resultados. Pero incluso si una correlación entre (por ejemplo) la creencia del experimentador (una medida de su posible influencia psi en la configuración) y el tamaño del efecto Ganzfeld, no se pudo llegar a una conclusión clara. Podría ser (1) el efecto del experimentador, (2) el efecto del analista del estudio (el que mira los datos primero), o (3) ¡muchas otras explicaciones potenciales! Este es nuevamente el mismo problema: si no hay un límite claro entre el experimentador, los participantes y la estructura científica, no hay afirmación falsable. Es importante destacar que este problema es infinito: cuando se introducen nuevas variables, sin una hipótesis claramente falsable (debido a la ausencia de un límite epistemológico entre el observador y lo observado), el problema existe. Esta falta de una clara causalidad atribuible es relevante para los resultados de la mayoría de los experimentos psi y es por eso que los efectos psi probablemente no sean lo que parecen. Pueden considerarse no concluyentes desde un punto de vista científico. Por lo tanto, no hay forma de estar seguro de que Ganzfeld sea una transferencia de información entre dos personas o que la precognición sea la capacidad de extraer información del futuro. Los estudios de Psi en realidad solo muestran que las correlaciones significativas entre dos variables, una intención y una medida, surgirán y tomarán diferentes formas dependiendo de las condiciones del entorno experimental.

Los experimentos recientes reportados por Bem (2011) sobre la anticipación anómala de eventos aleatorios ilustran perfectamente el problema que acabamos de describir. Bem (2011), que publica en una revista psicológica convencional, el Journal of Personality and Social Psychology, presentó los resultados de cuatro experimentos de psicología clásica (p. Ej., Tarea de preparación) que ha “revertido” para ver si los participantes se verían influenciados por estímulos no del pasado sino del futuro. Esta publicación provocó una controversia considerable entre los escépticos y los proponentes en la comunidad académica e incluso en varios medios de comunicación convencionales (Bem et al., 2011; Wagenmakers et al., 2011; Ritchie et al., 2012). Podemos resumir los diferentes pasos de este paradigma de investigación: (1) Bem (2011) muestra un efecto psi aparentemente confiable en condición controlada. Genera reacciones críticas de la comunidad en general (Wagenmakers et al., 2011). En cierto modo, estos críticos tienen razón: probablemente “sienten” que no parece un efecto clásico y tal vez entiendan intuitivamente las posibles consecuencias de este resultado para todo el campo de la psicología. (2) El experimento luego se replica en diferentes entornos (en línea, diferentes poblaciones, diferentes estímulos, etc.)[8]. A veces funciona, a veces no funciona (Galak et al., 2012; Ritchie et al., 2012). (3) Finalmente se publica un metaanálisis con un tamaño de efecto significativo, pero menor (es = 0.14), que la publicación original (es = 0.20; Bem et al., 2015)[9]. ¿Es porque: (a) el efecto realmente no existe; (b) el escenario de los nuevos experimentos era menos apropiado; (c) el proceso de replicación en sí mismo disminuye el efecto? (Lucadou, 1995; Kennedy, 2003); o (d) el efecto es en realidad la consecuencia de un efecto de experimentador descrito anteriormente? (Kennedy and Taddonio, 1976; Broughton, 1979; Palmer, 1997; Smith, 2003; Parker and Miller, 2014). Por tanto, es necesario un cuarto paso; y (4) se realiza simultáneamente un nuevo estudio en diferentes laboratorios para estudiar el impacto de las diferencias individuales de los experimentadores en los resultados. Pero este efecto en realidad podría depender del analista (es decir, el que mira los resultados por primera vez o analiza los datos) y no del experimentador (West and Fisk, 1953). Entonces, el siguiente paso de este paradigma de investigación podría ser (5) probar la magnitud del efecto con 10 experimentadores diferentes y 10 analistas diferentes.

Estos diferentes pasos muestran los posibles impedimentos que acosan a los investigadores de psi en sus esfuerzos por probar la existencia de psi, además de los resultados negativos y las críticas de los colegas de la corriente principal. E incluso si el investigador logra obtener resultados significativos en cada paso, como lo hizo Bem (2011) durante muchos años[10], siempre habrá nuevas demandas de la comunidad principal: más control del entorno experimental, más experimentos, más laboratorios, más herramientas estadísticas, etc., (Wagenmakers et al., 2015)[11]. Incluso cuando los proponentes logran acordar un protocolo claro con los escépticos y luego obtienen resultados significativos, como ha sido el caso de Ganzfeld (Hyman and Honorton, 1986; Bem and Honorton, 1994), nunca es suficiente. El problema subyacente es que incluso si se encuentra un efecto significativo en cada paso, no hay forma de concluir nada sobre la naturaleza del efecto y, en consecuencia, no hay forma de producir conocimiento científico sobre la fuente de psi (Broughton, 1979; Palmer, 1997): ¿es de los participantes? ¿Del experimentador? ¿Es de cada experimentador por separado? ¿O es una influencia más fuerte del primero que analiza los datos? ¿O tal vez el que originalmente concibió el experimento? ¿Hay grados de influencia entre el experimentador y los participantes según el tipo de experimento? Pero también, ¿es un efecto en el presente (durante el experimento) o es una influencia del futuro (después del experimento), o incluso del pasado, si psi puede trascender el espacio y el tiempo? No hay respuestas definitivas a estas preguntas, independientemente de los resultados que se obtengan y, por desgracia, no hay forma de responder a estas preguntas, hasta donde sabemos, porque solo hay interpretaciones plausibles. Fundamentalmente, el problema es que el marco epistemológico habitual de la investigación no es adecuado cuando se consideran las propiedades psi.

En este sentido, podría ser relevante dejar de hacer investigaciones cuyo objetivo sea probar la existencia de psi utilizando un entorno clásico (método científico), porque realmente no tiene sentido desde un punto de vista epistemológico. Se puede argumentar que esta metodología no puede producir nada nuevo incluso con una gran financiación y el paso de un siglo de investigación. Sin embargo, estos experimentos son relevantes en términos de ritual. Se puede utilizar una selección de experimentos psi clásicos, por ejemplo, los estudios de Ganzfeld, sueños o presentimientos, como ilustraciones de un fenómeno, reconociendo sus “limitaciones” y sin creer que alguna nueva explicación surgirá de ellos. Si se llevan a cabo con suficiente intención, motivación, novedad y creatividad, estos experimentos deberían seguir produciendo resultados significativos. Su interés es principalmente estratégico porque brinda la oportunidad de demostrar que psi puede replicarse y producir efectos significativos en condiciones controladas como lo demuestran varios metaanálisis (Cardeña, 2018).

Sin embargo, estos “estudios de demostración” podrían ser incluso más complicados si también tenemos en cuenta que los efectos psi tienden a desaparecer cuando se replica el mismo experimento, lo que se describe como la naturaleza esquiva de psi (Hansen, 2001; Kennedy, 2003). Cuando se configura un experimento psi, se propone una distinción entre dos variables o una hipótesis (verdadero/falso). Si otro experimento utiliza la misma hipótesis, muchos investigadores han informado que el efecto tiende a desaparecer (Kennedy, 2003)[12]. En este sentido, usar la misma hipótesis dos veces para un experimento psi podría ser como preguntarle a un comediante que intenta hacer reír al público con la misma broma dos veces. Las interacciones psi parecen ser la expresión de una novedad y la novedad, por definición, puede ser nueva solo una vez. Podría explicar los extraños resultados – inversión, desplazamiento y desaparición del efecto – que aparecen cuando se replica el mismo experimento (Lucadou, 1995). Para evitar esta dificultad, y siguiendo la metáfora de Sísifo, algunos investigadores toman una pequeña piedra (un experimento), la empujan hacia la montaña y luego hacen esto con otra piedra (otro experimento), pero no empujan la misma piedra dos veces para evitar demasiada “resistencia” que resultaría de la repetición del mismo experimento. No lo hacen porque el efecto no existe, como sugiere Wiseman (2010), sino como consecuencia de que esta es la única forma de mantener el efecto.

Debido a estas diferentes dificultades epistemológicas, los nuevos conocimientos en el campo de la investigación psi basados en el protocolo “clásico” no serían confiables e incluso los relacionados con la comprensión de los procesos psi. Por ejemplo, si los rasgos de personalidad están correlacionados con psi, ¿cómo estar seguro de que esto no es la consecuencia de la influencia psi del experimentador sobre qué rasgos de personalidad cree que favorecen a psi? Esto es igual para todos los parámetros que podrían correlacionarse con los resultados de psi[13]. Estas investigaciones no pueden producir conocimiento científico y, por lo tanto, pueden considerarse una pérdida de tiempo y energía de la misma manera que Sísifo dedica todo su tiempo a una tarea inútil e infinita. Algunos investigadores en el campo han reconocido este problema y han dejado de hacer este tipo de investigación experimental (Eisenbud, 1966, 1983). Otros entienden este problema y tratan de encontrar una manera de evitarlo con una configuración experimental específica (Lucadou et al., 2007; Walach and von Stillfried, 2011). Otros reconocen este problema, pero continúan haciendo investigaciones experimentales como esta porque este enfoque es relevante desde un punto de vista “político” y estratégico (Radin, 2018). Saben intuitivamente cómo realizar experimentos para mantener “vivo” un efecto psi a pesar de su naturaleza profundamente esquiva. Suponen que estos experimentos pueden ser útiles para convencer a toda la comunidad científica, y a un público más amplio, si se llevan a cabo de forma suficientemente rigurosa. Esto podría considerarse como un enfoque pragmático que utiliza las herramientas equivocadas para mostrar algo que podría ser cierto. Y otros investigadores no comprenden este problema y continúan haciendo este tipo de investigación, de la misma manera que lo hacía Rhine (1966), porque no sienten que haya otras opciones. Sería como un leñador que intenta talar árboles con una pluma diciendo que sigue haciéndolo porque esta es la única herramienta que tiene. Si tienen suerte, a pesar de la naturaleza inadecuada de la metodología de investigación, ocasionalmente obtendrán resultados significativos, pero también obtendrán resultados nulos. Si son resilientes, lo harán durante todas sus carreras y se convertirán en Sísifo, tratando de convencer a una comunidad científica que no cree en la existencia de lo que estudian. Como era de esperar, algunos de ellos dejarán de hacer investigación parapsicológica e incluso pueden volverse escépticos (Blackmore, 1987).

Crisis de replicabilidad, efecto de declive y psi

Como se mencionó en la introducción, la psicología y la medicina se han enfrentado durante más de 10 años a lo que se ha llamado la crisis de replicación o replicabilidad (Maxwell et al., 2015). Muestra que la magnitud de los tamaños del efecto en las réplicas de experimentos de psicología es la mitad del tamaño de los estudios originales y que solo el 36% del efecto puede ser replicable (Nosek et al., 2015). El mismo problema también es cierto para otros dominios, especialmente la investigación médica y de psicoterapia (Ioannidis, 2016a, b). Este es, por supuesto, un gran problema que muchos investigadores están tratando de resolver. Una de las hipótesis para explicar esta situación es que estos resultados podrían ser consecuencia de QRPs (John et al., 2012) y que la mayoría de estos estudios no habrían sido significativos si se hubieran realizado con más rigor (Simmons et al., 2011)[14]. En consecuencia, la conducta de “Ciencia” debe cambiar mejorando el uso, en particular, del prerregistro, mejores estadísticas y la publicación de resultados nulos.

La crisis de la replicación también ha subrayado un fenómeno llamado “efecto de declive” (Schooler, 2011; Simmons et al., 2011; Protzko and Schooler, 2017). Muestra que los diferentes efectos en psicología y medicina tienden a disminuir con el tiempo y el proceso de replicación, por ejemplo (ver Coyne and de Voogd, 2012; Gong and Jiao, 2019). En este sentido, es interesante notar que la comunidad psi ha reportado tal efecto de declive hace mucho tiempo (Kennedy, 2003). ¿Es el mismo efecto y cuál es su naturaleza? La mayoría de investigadores suponen que también es consecuencia del QRP[15] pero se podría proponer una hipótesis diferente; el problema subyacente de este efecto de disminución podría ser psi, si este último existe. Significa que es posible una relación directa entre una intención y la realidad. En consecuencia, cuando se establece la investigación general, la psi podría entrar en la ecuación incluso si no se la invita a la fiesta[16]. Cuando los investigadores desarrollan un nuevo protocolo o hipótesis, sus expectativas o intenciones pueden, a través de psi, inducir inconscientemente un resultado que favorezca su visión. Por lo tanto, cuando se prueba un nuevo efecto o un nuevo tratamiento, con, por ejemplo, un grupo de control, el investigador puede tener una influencia psi en varios puntos del diseño de la investigación[17], lo que podría comprometer la utilidad del grupo de control como condición de comparación. .

Como ejemplo de cómo esta influencia inesperada podría afectar los datos, May (1995) ha desarrollado la teoría del aumento de decisiones (DAT) para explicar los resultados de estudios en los que los participantes tenían que influir, únicamente por intención, en la salida de un generador de números aleatorios. (Bösch et al., 2006). May supone que no hay influencia física en este proceso y que el participante, utilizando habilidades precognitivas, elegirá (inconscientemente) el momento adecuado para presionar el botón con el fin de obtener el resultado significativo deseado[18]. De la misma forma, un investigador podría elegir inconscientemente el momento adecuado para iniciar el estudio, elegir los participantes, recolectar los datos, etc., para inducir un efecto de aleatoriedad. Desde este punto de vista, psi no induce una transferencia de energía ni se basa en una fuerza física conocida. Más bien organiza la realidad de manera discreta ordenando la aleatoriedad. En consecuencia, algunos de los efectos principales parecen efectos normales, pero no lo son. Solo cuando otros investigadores, que pueden no tener las mismas expectativas, creencias o intenciones, intentan replicarlos, estos efectos pueden desaparecer misteriosamente. Este no sería el efecto de QRP, sino la consecuencia de psi[19].

Se podría argumentar que si esta hipótesis es cierta, no hay posibilidad de acumular ningún conocimiento científico confiable. Pero este no es el caso porque todos los efectos observados no son atribuibles a psi; este último actúa como un “placebo extendido”, es decir, más allá de la concepción clásica de la influencia del placebo, ver Lucadou, 2019, que produce fluctuaciones inesperadas en los datos. Pero cuando un efecto “real” y robusto es replicado por diferentes equipos de investigadores, debería resistir si este no es un efecto psi, y esto podría ser lo que sucedió durante el proyecto de reproducibilidad (Nosek et al., 2015). Así, todavía es posible demostrar la existencia de efectos, leyes o fuerzas “establecidos”, “reales” o “clásicos” (que probablemente conciernen a la gran mayoría de la realidad) y, en este sentido, el modelo científico aún es totalmente relevante. Pero significa que los tamaños del efecto alrededor de 0.10 y 0.20, la magnitud habitual reportada en la literatura psi – en experimentos dentro de muchos dominios científicos, en realidad podría ser la consecuencia de psi[20].

La otra interpretación de los datos psi – que psi no existe, la “hipótesis nula” (Alcock, 2003) – también es interesante desde un punto de vista psicológico y sociológico. Como se propone en la introducción, sugeriría que cientos de investigadores (y notablemente más de 20 premios Nobel) han sido engañados durante más de un siglo, incluso cuando se utilizan las herramientas más fiables de la investigación científica. El efecto de estos resultados “ilusorios” ha sido tan convincente que incluso llevaron a aplicaciones prácticas (Schwartz, 2007; Mossbridge et al., 2014). Por ejemplo, el gobierno de los Estados Unidos intentó emplear psi durante más de 20 años durante un programa generalmente conocido como Stargate en el que se seleccionaba personal militar en función de sus supuestas habilidades psíquicas para adquirir información (por ejemplo, sobre sitios militares rusos) en un distancia (en espacio y tiempo; Hyman, 1996; Utts, 1996; May et al., 2018)[21]. La hipótesis nula significaría que el personal de las mejores agencias de inteligencia de Estados Unidos (CIA, NSA, etc.), varios oficiales militares que trabajan en este programa (algunos de los cuales fueron condecorados con la legión del mérito; McMoneagle and May, 2014), los principales científicos que han examinado el proyecto (en particular, un ex presidente de la Asociación Estadounidense de Estadística; Utts, 1996), e incluso el presidente de los Estados Unidos (Jimmy Carter admitió que se ha encontrado un avión militar Tu-22 perdido gracias al Stargate) han sido engañados por los resultados de 504 operaciones militares durante casi 20 años (1973-1995). Si se acepta esta interpretación de resultados significativos en experimentos psi, se puede deducir que otras áreas de investigación “acreditadas”, que involucran a muchos investigadores, también podrían producir resultados ilusorios.


[1] Este fue el enfoque clásico de la investigación psíquica a principios del siglo XX, y ha ido desapareciendo progresivamente en favor de estudios con participantes no seleccionados (Méheust, 1999). Esto es problemático porque los datos sugieren que el método original es probablemente más relevante (Schlitz and Honorton, 1992; May et al., 2018). El enfoque que se basa en participantes no seleccionados produce tamaños de efecto pequeños que solo se pueden mostrar a nivel estadístico y, por lo tanto, se critica fácilmente y es menos convincente. Por el contrario, trabajar con participantes “dotados” tiende a producir efectos más importantes (Eisenbud, 1966; Braude, 2007). Tres ejemplos de este tipo de experimentos, llevados a cabo en condiciones de control, son: un caso histórico, con Alexis Didier que habría podido leer varias veces una palabra y frases en un libro a distancia (Méheust, 2003); las imágenes fueron realizadas por Ted Serios con una cámara polaroid mientras estaba encerrado en una jaula de Faraday (Eisenbud, 1966); y el experimento de Pearce-Pratt en el que Pearce ha podido adivinar a distancia las cifras correctas (entre cinco posibilidades) 25 veces seguidas (Rhine et al., 1966). El argumento que suelen proponer los escépticos para explicar tales resultados es que tanto el experimentador como el participante estaban haciendo trampa (Hansel, 1961; Palmer, 2016).

[2] Un metaanálisis sobre este efecto también alcanzó un tamaño de efecto estadístico significativo (es = 0.14; Bem et al., 2015).

[3] La investigación psi no es única en este sentido. Se puede argumentar que muchos efectos en psicología no tienen una explicación subyacente desde un punto de vista biológico o físico. Pero estos efectos “clásicos” se aceptan fácilmente porque no cuestionan el conocimiento de estos dominios, que es el caso de psi. De hecho, no es habitual que la psicología diga algo sobre la realidad que pueda contradecir a las ciencias que estudian la materia y los organismos vivos.

[4] Ver https://psi-encyclopedia.spr.ac.uk/articles/eminent-people-interested-psi

[5] Como se sugerirá más adelante en este documento, los investigadores de psi pueden tener la posibilidad de evitar este camino.

[6] De hecho, el 18% de los estudios de Ganzfeld se han realizado sin un remitente y la mayoría de ellos todavía obtienen resultados significativos (Storm et al., 2010).

[7] Algunos investigadores ya han intentado hacer esto con un experimento en el que los participantes tenían que influir mentalmente en la actividad electrodérmica de otro participante (Schlitz et al., 2006).

[8] Por ejemplo, hemos replicado el experimento de retrocebado diseñado por Bem cuatro veces con un total de 344 participantes (t = 0.92; d = 0.049; IC = −0.016, 0.16; p = 0.360; Rabeyron and Watt, 2010; Rabeyron, 2014; Rabeyron et al., 2018). Uno de los experimentos también se ha realizado con una población compuesta por artista con el fin de incrementar el efecto pero no se ha obtenido ningún resultado significativo (Rabeyron et al., 2018).

[9] Este metanálisis también muestra que las replicaciones exactas son significativas (es = 0,8) y que el efecto proviene principalmente del protocolo de pensamiento rápido (es = 0,11). El protocolo replicado con más éxito ha sido la detección precognitiva de refuerzo (es = 0,14). Para un crítico de este metanálisis, consulte Lakens (2015).

[10] Bem ya había propuesto resultados significativos sobre psi desde la década de 1990 con los estudios de Ganzfeld (Bem and Honorton, 1994), incluso después de tener en cuenta los comentarios de los críticos.

[11] El filósofo francés Méheust (1999) propone una metáfora para describir este proceso cercana a la imagen de Sísifo. Él describe la investigación psi como un suéter que se deshace constantemente. Cada nueva generación tiene que “volver a tejer” para mantener la existencia del suéter porque constantemente son necesarias nuevas pruebas en función de la evolución de la metodología científica.

[12] Lo que, por supuesto, podría interpretarse de manera más simple como la prueba de la inexistencia de psi y el “argumento elusivo” podría considerarse como una hipótesis post-hoc para explicar resultados no significativos. Es por eso que actualmente los investigadores intentan demostrar este aspecto esquivo de psi (Maier et al., 2018; Maier and Dechamps, 2018), pero ¿es posible demostrar algo que se supone que es esquivo?

[13] Por ejemplo, se ha desarrollado una línea de investigación para determinar si la naturaleza de los objetivos durante un experimento psi podría influir en la calidad de los resultados. Se ha encontrado una correlación significativa entre las descripciones de los participantes y el grado de entropía del objetivo (por ejemplo, una imagen) desde un punto de vista informativo (May et al., 2000). Pero, ¿es un efecto “real” o la consecuencia psi de la creencia de los experimentadores (quienes, como físicos, interpretan lo que está sucediendo en términos familiares para ellos)?

[14] Como explica Cardeña (2019, p. 117-118), este problema de replicabilidad debido a errores estadísticos no es nuevo y ya ha sido descrito muchas veces desde la década de 1960: “Al igual que las mareas de los restos flotantes, la ciencia descubre ‘de nuevo’ errores del tercer tipo, término de Schlaiffer para el mal uso y la mala interpretación de los procedimientos estadísticos además de los errores de Tipo I y II (…) ¿Se han vuelto los científicos más perspicaces recientemente sobre los problemas de las aplicaciones inconscientes de los procedimientos estadísticos y de investigación? No, solo están reiterando ideas que llevan más de medio siglo”.

[15] La hipótesis QRP ha sido evaluada por Bierman (2016) empleando la base de datos Ganzfeld. Concluye que los resultados probablemente estén inflados debido al QRP, pero que aún son significativos (p = 0.003). Entonces, la hipótesis QRP no es suficiente para explicar los resultados de Ganzfeld y, por implicación, los resultados de muchos experimentos psi.

[16] Se han vuelto a analizar los experimentos clásicos de la corriente principal teniendo en cuenta la hipótesis psi, lo que a veces ha dado lugar a resultados significativos. Por ejemplo, Bierman (2000) ha encontrado un efecto presentimiento en los datos de los experimentos clásicos de Antonio Damasio.

[17] Los investigadores suelen tener una intención particularmente fuerte hacia sus resultados porque su capacidad para publicar en una buena revista, y su propia carrera, depende de los resultados que obtendrán. Paradójicamente, un experimento científico podría considerarse como una de las mejores configuraciones para inducir el efecto psi.

[18] Por ejemplo, si el participante tiene que pulsar un botón para poner una luz en verde o en rojo (el color de la luz depende del resultado del RNG), no tiene una influencia directa y mental sobre el RNG; De hecho, ha elegido el momento adecuado para pulsar el botón a fin de seleccionar una secuencia binaria aleatoria (más 0 o más 1) asociada con el color correcto.

[19] También se podría plantear la hipótesis de que otros efectos controvertidos como la homeopatía y diferentes formas de prácticas de la medicina complementaria y alternativa (Hyland, 2003) podrían ser la consecuencia de la psi (Walach, 2000; Lucadou, 2019).

[20] Si esta hipótesis es cierta, no solo es importante desde un punto de vista científico, sino que también significa que se pierde gran cantidad de dinero invertido en investigación científica porque en realidad se trata de efectos psi. En este sentido, sería fundamental encontrar una manera de discriminar los efectos “clásicos” de los “psi” para evitar este problema, que puede tener graves consecuencias, especialmente en la investigación médica.

[21] Este enfoque también se ha utilizado para la búsqueda de personas desaparecidas (Schwartz, 2007), arqueología (Schwartz, 2001) e inversión financiera (Bierman and Rabeyron, 2012).

Continuará…

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.