A lo dicho anteriormente hay que añadir que la perspectiva de un "pensamiento bayesiano" viene de mucho más atrás y sólo se solapa parcialmente con la analítica de datos. De hecho ésta se puede considerar como un elemento de una metodología muy amplia que cita Wing (2008) aplicada a una serie muy amplia de casos y procesos. La intuición de ese pensamiento bayesiano la he tenido, además de en esta ocasión, ante unos trabajos sobre corpora lingüísticos que me presentó Pascual Pérez Paredes, cuando estuve en Cambridge, ante un trabajo de Maths Cambridge y por último a partir del trabajo citado más arriba de The Lancet, sobre determinación de fallecidos en la pandemia.
En todos los casos es lo mismo, el Teorema de Bayes, en una versión para una gran cantidad de variables, toma como probabilidades inversas parciales las que suministran los procesos de análisis de datos. Por ejemplo, los fallecimientos por la pandemia en los países que primero la padecieron, obteniendo en ellos cuál era la función de probabilidad de los casos que se producían, condicionada a la de fallecidos, asumiendo que aquellos pudieran estar sesgados o falseados. Esto permitió a algunos países aprovisionarse. A otros no. Ese mismo mecanismo aparece en los casos complejos y diversos que Bundy (2017) señala en lo que llama pervasive computational thinking.
Como elemento de pensamiento
computacional, el pensamiento de Bayes es muy sencillo, comprensible y adquirible
como aprendizaje y su uso como habilidad desde los cursos de secundaria. La expresión
más sencilla del Teorema de Bayes es el teorema y fórmula de la probabilidad
inversa. Tiene todos los elementos del teorema de Bayes y su uso incluye todos
los elementos y características de esta forma de pensamiento.
Su deducción es muy sencilla, se basa en el concepto de probaabilidad condicionada, pero
no es cuestión de abordarla aquí. La fórmula es:
Es preciso conocer previamente en concepto de probabilidad condicionada. Esa es una probabilidad que se asigna a un suceso A, condicionada a que suceda otro suceso B, y se escribe P(A/B).
De esta manera la fórmula nos
permite obtener la probabilidad de A condicionada a B --- P(A/B) --- en función
o conociendo la probabilidad de B condicionada a A --- P(B/A) --- o probabilidad inversa.
Un uso muy frecuente, y que permite hacerse una idea de su potencia, es el relativo a obtener la eficiencia de un test, como el PCR para el COVID19.
Así, por ejemplo, esta fórmula nos permite obtener la probabilidad de que alguien esté enfermo de COVID cuando la
PCR da positiva, en función de la probabilidad del suceso inverso: La
probabilidad de que el test PCR de positivo estando el individuo al que se
practica enfermo. Como se ve, la probabilidad en el segundo caso es muy fácil de obtener pasando la prueba PCR a una población de la que sepamos positivamente
quienes están enfermos, porque así se les ha diagnosticado. Sin embargo la primera la
desconocemos absolutamente.
De igual forma podemos conocer a
priori la probabilidad de que alguien esté enfermo P(A), a partir de los datos empíricos
y de la frecuencia con que aparece la enfermedad. También podemos calcular la
probabilidad de que el test sea positivo, a partir de los datos empíricos sobre
los casos en que en una población sin otros datos previos, elegidos al azar por
ejemplo, dé positiva la prueba. Podemos pues conocer empiricamente todos los datos del segundo miembro de la fórmula.
El teorema de Bayes, en su versión clásica y completa, se formula para el caso en que el suceso A se pueda descomponer en un conjunto completo y excluyente de casos elementales, . Eso permite obtener la probabilidad de A, o de cualquiera de los sucesos en que se descompone, por la formula de la probabilidad compuesta a través de un conjunto de unos cuantos sucesos elementales. Cuando la población es muy grande y son muchos los sucesos elementales es cuando se utiliza la analítica de datos para computar esas grandes masas de datos, procesarlos y obtener las frecuencias.
La fórmula de Bayes entonces es:
Pensemos que el suceso A es tener
el COVID, y que la descomposición en un conjunto de casos completos y
excluyentes pueden determinarla los intervalos de edad, las zonas de origen,
los perfiles patológicos, etc. En este caso estaríamos en el supuesto que nos
ofrece la revista The Lancet, cuyos resultados son potentísimos con un
aparataje matemático muy simple.
Otra cuestión notable es que una instrucción
centrada en esta componente de pensamiento computacional, o que la incluyese, en
una fase temprana, en Secundaria con la fórmula de la probabilidad inversa, permitiría
activar estos aprendizajes como componentes muy valiosos y muy complejos en una
etapa posterior de la actividad profesional o investigadora, o en la fase de
formación, grados y postgrados, de estas profesiones o que capacitan para estas
actividades y profesiones.
------------------------
Bundy, A. 2007 Computational thinking is pervasive. J. Scient. Pract. Comput.1, 67–69. Google Scholar
Wing, J.M. (July 2008) Computational thinking and thinking about computing. The Royal Society Publishing. https://doi.org/10.1098/rsta.2008.0118 https://royalsocietypublishing.org/doi/10.1098/rsta.2008.0118 https://royalsocietypublishing.org/doi/pdf/10.1098/rsta.2008.0118
Zapata-Ros, M. (Agosto 2020). El pensamiento computacional, una cuarta competencia clave planteada por la nueva alfabetización (II). Una nueva línea: computational thinking everywhere, pervasive computational thinking y el pensamiento bayesiano. RED de Hypotheses. https://red.hypotheses.org/2123
Comentarios
Publicar un comentario