Funcionó el ‘Bloqueo Invisible’ contra el Chile de Allende?

[Este artículo es una traducción de este post del blog  Pseudoerasmus ]

Por Pseudoerasmus

Publicación original: 21 de Mayo de 2015

Logró un ‘bloqueo invisible’ de los Estados Unidos desestabilizar la economía Chilena bajo la presidencia de Salvador Allende (1970-73) ? Funcionó? En pocas palabras: No.

Nota: este post no trata sobre otras acciones de EEUU relativas al golpe de Septiembre del 73, o sobre el régimen del General Pinochet. Trata sobre las dimensiones económicas y financieras de las relaciones entre EEUU y Chile durante los años de Allende.

Sigue leyendo

La paradoja del PIB de Cuba

El cálculo del PIB cubano ocasiona a veces disputas. Hay quienes por un lado dicen que Cuba es uno de los países más ricos de Latinoamérica, y hay otros que dicen que la economía de Cuba es más bien mediocre. ¿Quién tiene razón, y a qué se debe esta discrepancia?

Echemos un vistazo al PIB per cápita de Cuba según el Banco Mundial.

Según esta medida, Cuba tendría un PIB per cápita en dólares constantes del año 2000 de alrededor de 5400$. Esto sitúa a Cuba en la ‘clase media’ de Latinoamérica: por debajo de loa países más ricos (Puerto Rico, Aruba y Las Bahamas tienen 4 veces más PIB), pero por encima de países como Haiti, Bolivia, Nicaragua, Paraguay, Guatemala, Jamaica o Colombia.

Para poder comparar dentro de una serie temporal para un país dado, esta medida usa dólares constantes para tener en cuenta la inflación. A continuación, para comparar diferentes países, se convierten las monedas nacionales a una moneda común, el dólar.

cuba

Esto, sin embargo, no tiene en cuenta el hecho de que los precios en cada país son diferentes. Es por eso por lo que se suele aplicar una tercera corrección, que es el ajuste por Paridad de Poder Adquisitivo (PPA). El Banco Mundial tiene datos del PIB corregido por PPA.

Según esta medida, Cuba pasa a estar por encima de bastantes más países, siendo superada sólo por las Islas Caymán, Aruba, Trinidad y Tobago, Las Bahamas, Chile, St. Kitts y Nevis, y Antigua y Barbuda. Cuba ocuparía la novena posición de 37 países.

Captura2

 

La paradoja surge cuando uno consulta los datos de PIB del Proyecto Maddison, que tiene como objetivo dar cifras de PIB históricas comparables. En lugar de usar dólares constantes de 2005 ajustados por PPA, usan dólares internacionales constantes (Geary-Khamis) de 1990. Esta medida también está ajustada por PPA.

En este medida, Cuba vuelve a estar entre los países menos aventajados de Latinoamérica, tanto si se examina su PIB en términos absolutos o relativos a 1960.

Captura

Captura2

Si estudiamos Cuba por periodos,

cUBAGDP

El primer periodo marcado en azul comienza tras el final de la Revolución cubana, caracterizada por un estancamiento del crecimiento.

El segundo periodo comienza con la entrada de Cuba en el Consejo de Ayuda Mutua Económica (COMECON o CAME), una organización de cooperación internacional promovida por la Unión Soviética. Cuba llegó a recibir importantes subsidios de CAME, incluyendo compras de azúcar, la principal exportación cubana, por precios 11 veces superiores a los de mercado. Con la entrada de la ayuda soviética, Cuba experimenta un fuerte crecimiento.

El tercer periodo corresponde al Periodo Especial: marcado por el fin de los subsidios soviéticos, y la necesidad de readaptar la economía. Durante el mismo, el gobierno lleva a cabo reformas que abren algo la economía al exterior, fomentando el turismo. Estas medidas tienen éxito, relanzando la economía del país.

La pregunta que queremos plantear y resolver aquí es: ¿Cuál es el verdadero PIB de Cuba? ¿Por qué dan estimaciones diferentes el Banco Mundial y Maddison?

Según dos de los economistas, hay dificultates con estimar qué índice de ajuste PPA aplicarle a Cuba, y explican cómo han tratado de superarlas:

Cuba, 1800-1902, Santamaría, A. (2005), ‘Las cuentas nacionales de Cuba, 1690–2005’ Centro de Estudios Históricos, Centro Superior de Investigaciones Científicas (mimeo). The level for 1800 assumed to be identical to that for 1792. 1902-1958, Ward, M. and J. Devereux (2009), “The Road Not Taken: Pre-Revolutionary Cuban Living Standards in Comparative Perspective” (mimeo) 1958 onwards, Maddison, A. (2009), Statistics on World Population, GDP and Per Capita GDP, 1- 2006 AD, last update: March 2009, horizontal file http://www.ggdc.net/maddison/. An important caveat is that Maddison (2006) level for 1990 has not been accepted. The reason is that given the lack of PPPs for Cuba in 1990 Maddison (2006: 192) assumed its per capita GDP was 15 percent below the Latin American average. Since this is an arbitrary assumption, I started from Brundenius and Zimbalist’s (1989) estimate of Cuba’s GDP per head relative to six major Latin American countries (Argentina, Brazil, Chile, Colombia, Mexico, and Venezuela, LA6) in 1980 (provided in Astorga and Fitzgerald 1998) and applied this ratio to the average per capita income of LA6 in 1980 Geary-Khamis dollars to derive Cuba’s level in 1980. Then, following Maddison (1995: 166), I derived the level for 1990 with the growth rate of real per capita GDP at national prices over 1980-1990 and reflated the result with the US implicit GDP deflator to arrive to an estimate of per capita GDP in 1990 at 1990 Geary-Khamis dollars. Interestingly the position of Cuba relative to the US in 1929 and 1955 is very close to the one Ward and Devereux (2009) derived with a different approach. (Bolt & van Zanden 2013)

A su vez, Ward y Devereux (2009) aplican un método diferente, el Índice Ideal de Fisher

The Penn World Tables (the PWT) and Maddison (2007) value income with world prices calculated using the Geary Khamis procedure. In simple terms, Geary Khamis world prices are the expenditure-weighted average of national prices for all economies. We lack sufficient data to calculate Geary Khamis price indices for Cuba. For our bilateral comparison, the Fisher Ideal index has theoretical advantages over the Geary Khamis index. In particular, it is a “superlative index” and does not suffer from a substitution bias arising from using a fixed set of world prices see Diewert (1976), see also Neary (2004).

Hasta ahora, dos de los métodos empleados aquí (dólares GK e índice ideal de Fisher) dan resultados similares.

¿Qué hace el Banco Mundial? Lo mismo que hacían las Penn World Tables (PWT): usar los índices de precios del International Comparison Program (of prices) del Banco Mundial. Varios autores que participaron en la elaboración de las PWT han criticado la versión de 2005 del índice de precios. En la versión previa a la actual de las PWT, sí aparece Cuba, indicando valores de PIB ajustado por PPA similares a los del Banco Mundial.

En la última revisión de los índices de precios del Banco Mundial, ya no aparece una estimación de su PIB, indicando que

The official GDP of Cuba for reference year 2011 is 68,990.15 million in national currency. However, this number and its breakdown into main aggregates are not shown in the tables because of methodological comparability issues. Therefore, Cuba’s results are provided only for the PPP and price level index. In addition, Cuba’s figures are not included in the Latin America and world totals.

Si los economistas encargados de las PWT y del propio Banco Mundial dudan de sus estimaciones del PIB ajustado de Cuba, es difícil darlas por válidas. Las de Maddison y Ward-Devereaux, en cambio, parecen dar resultados similares, por lo que quizá su método sí sea válido.

Tampoco UNDP, la agencia de la ONU encargada de elaborar el  Índice de Desarrollo Humano (IDH) da por bueno el PIB de Cuba en su edición de 2010. En 2015, usando un PIB revisado, el HDI cae a 0.759. Cuba deja por tanto de ser el segundo país con el HDI más alto de Sudamérica para pasar a ser el noveno.

The 2013 HDI value published in the 2014 Human Development Report was based on miscalculated GNI per capita in 2011 PPP dollars, as published in the World Bank (2014). A more realistic value, based on the model developed by HDRO and verified and accepted by Cuba’s National Statistics Office, is $7,222. The corresponding 2013 HDI value is 0.759 and the rank is 69th.

Así pues, con los datos del PNB per capita (No PIB, pero esto no es relevante) revisados (dólares de 2011, ajustados por paridad de poder adquisitivo), comparando con los países de Sudamérica, Cuba queda así:

Trinidad and Tobago 26.090
Argentina 22.050
Bahamas 21.336
Chile 21.290
Saint Kitts and Nevis 20.805
Antigua and Barbuda 20.070
Uruguay 19.283
Panama 18.192
Venezuela (Bolivarian Republic of) 16.159
Mexico 16.056
Brazil 15.175
Costa Rica 13.413
Barbados 12.488
Colombia 12.040
Dominican Republic 11.883
Peru 11.015
Grenada 10.939
Ecuador 10.605
Dominica 9.994
Saint Vincent and the Grenadines 9.937
Saint Lucia 9.765
Paraguay 7.643
Jamaica 7.415
El Salvador 7.349

Cuba

7.301

Guatemala 6.929
Guyana 6.522
Nicaragua 4.457
Honduras 3.938
Haiti 1.669

De 30 países, Cuba ocupa la posición 25, con Guatemala, Guayana, Nicaragua, Honduras y Haiti por detrás.

De 12 islas caribeñas, Cuba es la número 11, sólo por delante de Haiti.

Conclusión

Por un lado, tenemos la estimación del Banco Mundial, que el propio Banco Mundial cuestiona. Por otro lado, tenemos las estimaciones de Ward-Devereux, Maddison y UNCP. Estas tres fuentes parecen coincidir aproximadamente en la posición relativa de Cuba dentro de las economías latinoamericanas. Esta triple coincidencia, frente a los datos del Banco Mundial, que cuestiona sus propias estimaciones, debería decantarnos a favor del consenso: que Cuba es un país pobre dentro de latinoamérica.

Una crítica a esto es que deberíamos comparar otros indicadores: mortalidad, esperanza de vida, escolarización, o malnutrición. Eso también es de interés, pero no el objeto de este post.

La paradoja del PIB cubano queda pues resuelta.

Niveles de conocimiento económico

Bryan Caplan escribió un artículo hace tiempo presentando un esquema del conocimiento macroeconómico por niveles. Recientemente, Anthony J. Evans, en Markets for Managers, presenta una idea similar:

Or, as Arnold Kling puts it, there are three schools of thought. To Chicago economists ‘markets work, use markets’. To Keynesian economists ‘markets fail, use government’. But to Austrian economists ‘markets fail, use markets’. If there’s inefficiency, then there is waste. And all waste is a profit opportunity. It is precisely because markets fail that there’s an incentive for entrepreneurs to find new ways to do business. The identification of friction does not cast doubt on the ability of markets to serve as a coordination device. As my professor Peter Boettke would say, if it wasn’t for real world friction we’d fall over whenever we tried to put one foot in front of the other. The ‘information economists’ are right – friction is the norm. But this isn’t necessarily a bad thing. After all, try to imagine a world of perfect information. In the movie ‘What Women Want’, Mel Gibson had the power of understanding exactly what women were thinking. There was less of an information asymmetry. But even if such a world were possible, it wouldn’t necessarily be desirable.

Nivel 1, La posición popular (Los mercados fallan mucho, el Estado funciona mejor, usa el Estado a ser posible): Los mercados son horribles y de suma cero. Hace falta regular todo aspecto de los mismos, o incluso nacionalizar algunas industrias y el libre comercio. En el extremo, de no ser por los problemas prácticos que tiene, implementar la planificación central.

Nivel 2, Economía de Primer Semestre (Los mercados funcionan bien, el Estado suele fallar, usa los mercados siempre): Los mercados son geniales. Pueden resolver todo problema que te imagines fácilmente. Los Estados empeorarán siempre las cosas si intervienen.

Nivel 3, Economía de Segundo Semestre (Los mercados suelen fallar, los Estados a veces funcionan, usa el Estado a veces): Los mercados fallan. Hay externalidades, bienes públicos, y fallos de mercado. Por tanto, aunque los mercados están bastante bien, el Estado tiene un papel importante que jugar a la hora de regularlos y asegurar de que funcionen adecuadamente. Los mercados totalmente libres son una fantasía.

Nivel 4: Public Choice (Los mercados fallan a veces, los Estados fallan más, usa los mercados): Los Estados también fallan. Los fallos de mercado deben ser tenidos en consideración junto con los fallos de Estado, y resulta que en muchas ocasiones, los costes de la intervención estatal superan a sus beneficios, por lo que es mejor dejar fallos de mercado sin resolver.

Nivel 5, Análisis Institucional/Cultural (Los mercados funcionan muy bien, los Estados no funcionan tan bien, usa los mercados). La acción voluntaria, y las normas institucionales, culturales, y morales pueden resolver, hasta cierto punto y dado el tiempo suficiente, externalidades, fallos de mercados y proveer bienes públicos. La gente no es completamente egoísta, y puede diseñar ingeniosos arreglos institucionales y contratos para permitir una cooperación más robusta. Las condiciones económicas para la eficiencia económica son vistas como suficientes, no necesarias. Esto explica por qué los Estados funcionan mejor de lo que describe la Public Choice, pero también por qué los mercados funcionan aún mejor de lo que las teorías de fallos de mercado describen.

Ocurre algo curioso: El Nivel 5 es similar al Nivel 2, que es un nivel mucho menos sofisticado, lo que puede explicar la escasa popularidad del Nivel 5. Los que ocupan este nivel pueden parecer los ‘fundamentalistas del mercado’ del Nivel 2, inconscientes del conocimiento del Nivel 3. Brya Caplan ilustra esto aquí:

So just to play into your fears, I’ll begin by quoting Dr. Horrible’s Sing-Along Blog.  In this scene, Penny is telling Dr. Horrible about her last date – never realizing that Dr. Horrible is secretly in love with her.

Penny: But, he turned out to be totally sweet. Sometimes people are layered like that. There’s something totally different underneath than what’s on the surface.
Dr. Horrible: And sometimes there’s a third, even deeper level, and that one is the same as the top surface one. Like with pie.

This scene perfectly captures what I’m going to tell you about health care.  On the surface, a free market in health care seems like the best approach.  When you look a little deeper, the free-market approach seems naive and dangerous.  When you look deeper still, however, the free market approach turns out to be the best after all.

¿Son perjudiciales los programas de guardería universales?

A child is a curly, dimpled lunatic.

RALPH WALDO EMERSON

En episodios anteriores de Katalepsis, vimos que el estado de la literatura actual sobre los efectos de programas de guardaría universales es que éstos no tienen efecto sobre las habilidades cognitivas a largo plazo, pero que sí los tenían para las no-cognitivas, y que eso a su vez mejoraba las condiciones de vida futuras del niño, reduciendo la criminalidad, etc.

Recientemente ha salido un artículo que, sin cuestionar agresivamente lo anterior, pone sobre la mesa un contraejemplo: Un programa de guardaría universal implementado en Ontario que ha causado un empeoramiento de las habilidades no-cognitivas, y que ha supuesto un empeoramiento en la calidad de vida de los niños. ¿Cómo es eso posible?

El estudio es Non-cognitive deficits and young adult outcomes: The Long Run Impacts of a Universal Child Care Program, de Baker, Gruber y Milligan (2015). Es un working paper, no un artículo publicado en un journal revisado por pares. No obstante, en el artículo citan otros estudios de trabajos previos sobre el programa de Ontario que confirman su tesis.

El propósito del paper en sí no es tanto confirmar que el programa en cuestión tiene los efectos que tiene, sino ver si estos efectos (empeoramiento de habilidades no-cognitivas) conllevan deterioros en salud, satisfacción vital o criminalidad.

In this paper, we develop a causal estimate of the relationship between negative shocks to young children’s non-cognitive skills and their later life outcomes. To do so we study the longer-run impacts of the largest experiment with universal child care in North America in recent years: an introduction of very low cost child care for children aged 0-4 in Quebec beginning in 1997. In an earlier paper (Baker, Gruber & Milligan 2008, henceforth BGM) we documented that relative to the rest of Canada, where child care services remained unchanged, Quebec saw large increases in maternal labor supply and in the placement of children in child care (see also Lefebvre and Merrigan 2008 and Lefebvre et al. 2009). However, at the same time, there was a large, significant, negative shock to the preschool, non-cognitive development of children exposed to the new program (with little measured impact on cognitive skills). Subsequent research (Kottelenberg and Lehrer 2013a) has confirmed that this negative impact of the program on young children’s non-cognitive development has persisted as the program has matured.

Los autores indican también que la evidencia sobre estos programas en Europa no es clara, pero que el programa de Quebec es similar a los Europeos en su universalidad, y que es de interés para estudiar estos programas en general, y su aplicación particular a la región Norteamericana.

Our paper also extends the record of North America’s best known experiment in universal preschool care and education. Universal programs like the one in Quebec, are more common in Europe. While the evaluation of their impacts is mixed (Dustmann et al. 2013, Felfe et al. 2015, Datta Gupta and Simonsen 2010, Havnes and Mogstad 2011), the external validity of the European evidence to other jurisdictions is not clear. European programs are run under different funding levels, which reflect the public’s greater acceptance of an active state and government’s assumption of a larger proportion of economic activity. The Quebec experience is important for understanding a universal initiative within the context of North American tax structures and labor market norms.

Apuntan también a que algunos estudios en EEUU que señalan que las guarderías no aumentan las habilidades cognitivas, pero sí deterioran las no-cognitiva, aunque esa literatura tiene problemas. Reseñan también los estudios experimentales como el Abecedarian y el de Perry Preschool, que no eran universales, sino enfocados a los niños provenientes de familias de renta baja. Estos programas sí encontarron mejoras:

A recent view of effects of previous child care exposure on outcomes in adolescence suggest that more hours in child care in general does not affect test scores, but has a negative effect on non-cognitive outcomes, such as impulsivity and risk-taking (Vandell et al., 2010). That study, typical of many in the literature, relies on parental choice of child care mode, raising the question of whether any estimated impacts of child care mode are causal or due to selection by parent type. Similar problems plague the large existing literature in economics on maternal work and child outcomes.
A growing body of evidence comes from the use of experimental and quasi-experimental methods to examine the impacts of child care. Perhaps best known are programs targeted toward at-risk children; for example the experimental variation embedded in the evaluations of the Abecedarian and Perry Preschool interventions. These randomized trials from the 1960s have shown that high quality pre-school targeted to low-income children has substantial positive effects. For example, Heckman et al. (2010) estimate a statistically significant annual return of between 7 and 10 percent for the Perry Preschool intervention. Carneiro and Heckman (2003) summarize the evidence from these programs as improving motivation and social skills, while reducing crime and related behavior. Importantly for our work, Heckman et al. (2013) argue that the non-cognitive improvements were pivotal to the long-run impact on participant outcomes.

Recalcan que este artículo es de un programa universal, no uno dirigido como los que acabamos de citar:

Unlike the experimental evaluations of model programs, our paper focuses on a universal program that services a more economically and socially diverse group of children. In contrast to the literature on programs targeting at-risk children, the evidence on broader programs is mixed (see Baker 2011 and Cascio 2015 for recent overviews). In addition to the previous studies of the Quebec program, which are documented below, there have been evaluations of programs in Denmark, Norway, Spain and Germany.

[…] As with the European studies, the recent
American evidence mostly fits the pattern that the positive impact of universal programs is concentrated in more at-risk children.

[…] To summarize, the literature on child care and preschool seems to indicate that high-quality interventions for low-income populations deliver both short and long-run benefits. But broader child care expansions do not appear to provide short-term benefits, with mixed evidence on long-term effects.

A continuación presentan el programa de Quebec

Introduced in September 1997, the goal of the Quebec child care policy was to provide regulated child care places to all children aged 0-4 in the province at a price of $5 per day, with the rest of the cost covered by government subsidy. This program raised child care subsidies to almost 80 percent on average in the province, which can be compared to subsidies of roughly one-third in the other provinces.4 Children were eligible for the program whether or not their parents worked.

Junto al subsidio, también se intentó mejorar la calidad del personal cuidador:

The introduction of the program was accompanied by some important reforms of the structure of child care provision. Formal qualifications for caregivers were raised and operational regulations were modified. The government also introduced new wage policies in the sector to make employment more attractive

En el apartado de estudio empírico, mencionan algunos índices a medir: ansiedad, agresión, hiperactividad, o comportamiento prosocial, así como habilidades cognitivas a través de tests estandarizados. En el caso de adolescentes, tomaron también medidas de criminalidad.

En las habilidades cognitivas, no obtuvieron una variación apreciable.

The inference for science and reading scores is a more consistent story of no impact of the Quebec program. Overall there is no strong evidence in these estimates that the Quebec Family Plan had a lasting impact on children’s cognitive development.

En las no-cognitivas, replican estudios anteriores sobre el impacto del programa:

Taken together, the negative impact of the Quebec program on the non-cognitive outcomes of young children appears to persist and grow as they reach school ages.

Y como aportación nueva, añaden los efectos del programa en los niños y en los adolescentes que ya pasaron por el programa:

[…] Overall, these results give strong indications of a worsening of both health and life satisfaction among those older youths exposed to the Quebec child care program.

[…] The estimates are generally consistent with the graphical evidence: exposure to the Quebec program leads to higher rates of crime. Looking first at all crime counts, the estimates from the simple difference-in-differences specification indicate increases in both the rates of accused and convictions that is statistically significant.

[…] The impact of exposure to the Quebec program is largest for other criminal code convictions; the estimates from the richest specification show an increase in accusations of these crimes of 321 per 100,000 children, or nearly 19 percent of the mean, and for convictions for these crimes of 310 per 100,000, or about 28 percent of the mean. The estimated impacts on property crimes are almost as large. Consistently smaller are the estimated impacts on crimes against persons, at 11 percent of the mean for both accusations and convictions. Finally, the impact for drug crimes is 7.5 percent of the mean for accusations but over 17 percent of the mean for convictions.

El empeoramiento no fue similar para niños y niñas. Ellos tuvieron mayores incrementos de agresividad, y ellas, mayores caídas de prosocialidad.

We see much stronger impacts on hyperactivity and aggression for boys, even relative to their higher standard deviations. For example, the negative impact on Aggression is primarily for boys, and the estimate in this case is one third of a standard deviation. For girls the strongest effect is on prosocial behavior, which worsens by 22 percent of a standard deviation. The larger impacts for boys on aggression in particular suggest that there may be gender differences in the impact of the program on criminal activity later in life.
Indeed, that is what we see in the gender splits in crime rates in Table 7. The estimates indicate larger absolute impacts on the crime rates for boys, particularly for other criminal code violations and drugs.20 Therefore, the gender differences in the impacts of the Quebec program on crime rates line up with the gender differences in the impact of the program on non-cognitive development.

Concluyen:

[…] Indeed, our evidence is consistent with such symmetry. We find that the Quebec policy had a lasting negative impact on the non-cognitive skills of exposed children, but no consistent impact on their cognitive skills. At older ages, program exposure is associated with worsened health and life satisfaction, and increased rates of criminal activity. Increases in aggression and hyperactivity are concentrated in boys, as is the rise in the crime rates.

In evaluating the implications of our results for the universal option, the key question for policy-makers is whether the evidence of negative impacts are particular to the Quebec program, or whether the lessons apply more broadly to other such expansions in child care. Our findings for young children clearly contrast with those of the Perry, Abecedarian, and Head Start studies. These latter programs both provide higher quality care and are targeted at less advantaged children. An important outstanding question is whether universally provided child care can have widespread positive impacts on non-cognitive development, which our results together with evidence such as Heckman et al. (2013) suggest should lead to long run positive outcomes.

La última parte parece contradecir al propio estudio, que demuestra que un programa universal es perjudicial para los niños, pero leyendo bien dice que lo que ellos y otros han probado es que hay una relación positiva entre habilidades no-cognitivas y condiciones de vida. En este artículo prueban que la relación es simétrica, cosa que estaba poco estudiada.

La cuestión es: ¿Por qué unos programas funcionan y otros no? En el artículo no se aborda esta cuestión, pero podemos elucubrar una hipótesis: Dado que los programas que funcionan bien son los enfocados a los niños desfavorecidos, y los programas universales no dan resultados claros, es posible que una guardería sea mejor que el cuidado de los padres del niño en el primer caso, pero que sea peor que el de los padres del primero.

~ Nira ~

STEM: Los hombres van a Marte, las mujeres van a Venus

Traducimos el artículo de Ben Southwood STEM: men go to Mars, women go to Venus (Podéis seguirle en @bswud y leerle en el blog del Adam Smith Institute) en respuesta al artículo recientemente publicado en Politikon de Guido Corradi (@GuidoBCor, podéis leerle en Rasgo Latente), que hemos traducido aquí al inglés.

Por Ben Southwood

26 de Junio de 2015

Recientemente, le preguntaron al Nobel biólogo de la UCL Tim Hunt, recientemente expulsado de su cátedra por una turba enfurecida tras bromear diciendo que las científicas causan problemas al enamorarse de sus pares masculinos y que lloran si se las critica, si pensaba que la relativa falta de mujeres en las ciencias más duras era un problema. Él respondió, cometiendo el más puro crimental:

No estoy seguro de que realmente haya un problema, la verdad. La gente simplemente mira a las estadísticas. Me atrevo a pensar, yo mismo, que no hay ninguna discriminación, ni en contra ni a favor de hombres o mujeres. Pienso que la gente es realmente buena al seleccionar a buenos científicos, pero debo admitir que la desigualdad de resultados, especialmente al más alto nivel, es bastante impactante. Y no tengo ni idea de por qué. Uno podría empezar preguntándose por qué el hecho de que las mujeres estén infra-representadas en las posiciones senior es un problema tan grande. ¿Es realmente algo malo? No es inmediatamente obvio para mí … ¿Es esto malo para las mujeres? ¿O malo para la ciencia? No lo sé, pero claramente molesta mucho a la gente.

Aunque no responde directamente a Hunt, la importante página de habla hispana Politikon tiene un artículo (Amablemente traducido para mí) negando de forma preventiva que el tipo de diferencias sexuales que pudieras estar causando estas diferencias puede «legítimamente» existir.

Por supuesto, todo el mundo acepta que existen grandes diferencias entre hombres y mujeres en algunos dominios. Por ejemplo, nadie piensa que las mandíbulas más pronunciadas de los hombres, o sus ritmos de metabolismo basal más altos sean constructos sociales. Nadie piensa que el hecho de que incluso las mujeres atletas tienen menos fuerza que los hombres corrientes dependa de la sociedad.

Pero algunos, incluyendo al autor Guido Corradi, piensan que la construcción social es responsable de que se juzgue a hombres y niños como mejores en tareas espaciales y matemáticas. Ataca a Simon Baron-Cohen como originador de esta idea, y la juzga como especulativa y carente de evidencia que la respalde. Acepta que los hombres destacan más en habilidades visual-especiales (e.g. rotación mental 3D), pero que no tienen mayores habilidades matemáticas en general.

Otros estudios más recientes (Lindberg, et al. 2010) sostienen la hipótesis de que no existen diferencias sexuales en compentencias matemáticas. Cabe destacar que desde que se tiene registro las diferencias en la medición del rendimiento general en matemáticas ha ido decrenciendo. Ya en un meta-análisis de Hyde (1990) se observa esta tendencia. Cuando incluimos trabajos más recientes como los anteriormente citados, podemos confirmarla.

Lindberg et al. parecen mostrar de forma convincente que las niñas y los niños son igualmente buenos en matemáticas, de media. Pero esto no significa que las cosas sean iguales a lo largo de todas la escala, porque los hombres pueden presentar mayores diferencias que las mujeres. Corradi parece saber que esta posibilidad existe, pero descarta este punto sin darle mucha importancia.

Lindberg et al. encuentran un ratio de variabilidad pequeño, de 1.08, pero otros estudios sugieren que aún esto es suficiente para que exista una brecha sustancial en la parte más alta de la distribución. Johnson et al. (2008), en esta parte superior, encuentran que hay dos hombres por cada mujer. Deary et al. (2007) encuentran que, en un estudio con hermanos para controlar por genes y ambiente, cuando estudias el 2% más alto, también hay aproximadamente el doble de hombres que de mujeres.

Podemos ver como esto abre una brecha cuando empiezas a seleccionar a gente de cierto talento, como los que se presentan a los exámenes SAT:

 

Y se ensancha cuando llegas al GRE:

Esto explica parte de los diferentes resultados para hombres y mujeres en Ciencia, Tecnología, Ingeniería y Matemáticas (STEM, por sus siglas en inglés), pero los ratios al nivel de posiciones de profesorado están en el rango de entre 7:1 y 14:1, dejando bastante espacio. ¿Es esto debido a discriminación? ¿Estereotipos? ¿Construcción social? ¿Diferentes preferencias?

Una gran parte de la brecha se debe a la distribución de habilidades. Las mujeres que tienen grandes habilidades matemáticas tienen más probabilidades de tener también mayores habilidades verbales que los hombres, abriéndoles un número extra de opciones que los hombres no tienen a ese nivel. Aquellas con habilidades verbales altas tienden a perseguir estas opciones. Esto explica una parte de la brecha restante.

Por otro lado, la amenaza de estereotipo, a la que alude Corradi, está bastante de moda. Yo mismo, debo admitir, difundí uno de los estudios que sugerían que las diferencias hombre-mujer en matemátiacs podían ser debidas a estereotipación. Pero no parece que estos resultados hayan aguantado el paso de la replicación. (e.g. este meta-análisis, más, más, más)

Por contra, tanto el hombre como la mujer parecen tener preferencias fuertemente diferentes sobre cómo quieren que sean sus vidas. Por ejemplo, las mujeres tienden a tener diferentes tipos de relaciones (parejas diádicas una-a-una vs grupos gregarios multipolares) y tienden a desempeñar más labores de crianza infantil.

Las mujeres (incluso aquellas con más talento) tienden a querer trabajar menos y de forma más flexible; ninguna de las cuales encaja con las largas horas continuadas de trabajo que se espera de una posición alta en las profesiones o la academia STEM. Goldin (2014) explica cómo esto lleva a que no existan brechas salariales de género en las industria con retornos constantes por horas, pero a que las haya grandes en industrias donde 60 horas de trabajo a la semana son más del doble de productivas que 30 horas.

Su & Rounds (2015) revisan 52 muestras de entre 1964 y 2007, incluyendo 209,810 hombres y 223,268 mujeres en su muestra y encuentran grandes diferencias en intereses

Encontramos que las diferencias de género en intereses varían mucho según el campo STEM, estando las más grandes (de intereses que favorecen a los hombres) en disciplinas de ingeniería (d=0.83-1.21), y por contra, diferencias de género que favorecen a las mujeres en ciencias sociales y servicios médicos (d=-0.33 y -0.40, respectivamente). Es de destacar, la composición de género (el porcentaje de mujeres) en campos STEM refleja estas diferencias de género en intereses.

En general la evidencia parece mostrarnos que aunque los hombres y las mujeres sean igual de inteligentes, los hombres son más prominentes en ambas colas de la distribución: es más probable que sean los menos aventajados y los más brillantes. Esta varianza no es grande en general, pero cuando empiezas a seleccionar de entre el top 0.01% o el top 0.0001%, como Medallistas Fields, Premios Nobel o Profesores de Harvard, las diferencias se hacen enormes. Las mujeres que tienen estas habilidades cuantitativas increíbles suelen tener también habilidades verbales excelentes, dándoles alternativas que prefieren.

Aunque pueda haber discriminación residual, hay evidencia sustancial de que además la diferente varianza y distribución de habilidades, los hombres y las mujeres tienen diferentes preferencias. Las mujeres prefieren trabajar menos y concentrarse más en otros objetivos vitales importantes. Los hombres quieren competir, ganar mucho dinero y trabajar con objetos.

Corradi hace un salto abrupto e injustificado: hay buena evidencia de que existen numerosas diferencias de género —no sólo en habilidades cognitivas, sino en intereses y preferencias—que hacen que la completa y exacta similitud entre hombres y mujeres en los campos STEM sea una ilusión.

 

 

Gender and numeracy skills

We have translated an article by psychologist Guido Corradi published in the Spanish site Politikon. You can follow him via twitter in @GuidoBCor or read him in Rasgo Latente.

By Guido Corradi

Link to original text: http://politikon.es/2015/06/23/genero-y-aptitud-numerica/

23rd of June, 2015

The proportion of men choosing a technical degree is higher than that of women. Is this, perhaps, because girls might have lower mathematical aptitude owing to different evolutionary roles? Today, despite the latest scientific findings, many myths and erroneous beliefs remain accepted as true by both society and by a segment of the scientific community. As Elizabeth Spelke (2005) points out, some ideas which may sound plausible but must be questioned are: a) Men possess higher mathematical aptitude due to higher spatial abilities; b) From their youth, men are more focused on objects; and c) The higher variance in male cognitive ability explains why there are more men in the upper deciles. As we’ll see, these arguments make for plausible-sounding narratives, even though they are far from having a solid empirical basis. While it is true that there are gender differences, these do not affect mathematical skills. What’s critical is the social context in which mathematical aptitude emerges, as reflected in differences among countries in cross-section, or over time.

What is the evolutionary origin of the capabilities that allow us to use numbers? Thirty thousand years ago, humans were using pieces of bones to represent quantities. Twenty five thousand years later, the first symbolic representation of quantities –numbers– appear. Nowadays, children learn complex mathematical concepts (verbalization of quantities, subtraction, addition, number representation) in their childhood. Mathematics took thousands of years to develop; yet it doesn’t take many years for children to acquire a great knowledge of it. The basic ability of distinguishing quantities, for example, is present in animals as removed from humans as fish. However, as far as we know, we don’t have evidence they can even learn to multiply. From experimental evidence, the ability to manipulate quantities is based on the ability to track moving objects and on the intuitive discrimination of quantities. Both capacities arose in response to evolutionary pressures, but today we humans employ them in a different way.

With this we can weave a pop evolutionary psychology just-so story: boys evolved to hunt, and that’s why their mathematical ability – related to spatial perception- is superior, and from there emerges their superiority in mathematics that in turn leads to a greater number of them pursuing technical skills. But nothing could be farther from the truth. Even though there exists sexual dimorphisms (for example, in spatial navigation), mental rotation and linguistic capacities, there are no sexual differences in the basic mechanism with which numerical cognition operates.

Further, mathematical ability depends on many factors that interact beyond the basic mechanisms outlined previously. Mathematical thinking includes numerical cognition, but that’s not the only factor. Mathematical thinking — which is to say, the ability to operate with, work with, and represent numbers — is an amalgam of simpler skills like numerosity perception. But without the use of language, this capability, even if it already exists, cannot completely develop to full potential. Since mathematical ability is a composite of many other abilities, it’s not farfetched to think that sexual differences can compensate one another through the variability of different underlying abilities. In simpler terms: a higher level of one of these abilities can compensate a deficit in one of the others.

Another idea defending the male advantage over women in mathematical aptitude is the Baron-Cohen hypothesis: that boys become systematizers because they are focused on objects and mechanisms. That early focus would lead them to a better comprehension of abstract mathematical systems. However, if we follow the empirical evidence for this hypothesis, we only find a work by Connellan (2000). There are some points to be noted about this study. The norm in psychology is, we cannot arrive at big conclusions unless we have not only results but also revisions and meta-analysis of results. Because it is very easy to take conclusions out of context and go beyond what the data justify. In Connelan’s paper, a big leap is made from talking about baby sight fixation to talking about early male object preference. When this same experimental paradigm is used in adults, no differences are found.

According to the literature, neither spatial navigation skills, nor differences in the variability of cognitive ability, nor the hypothesis of male systematization offer evidence for gender differences in mathematical aptitude which can also explain the differences in the choice of degree leading to technical careers. There are no differences in the basic abilities underlying mathematical aptitude.

And what when we investigate the results of these cognitive abilities? When reviewing a meta-analysis of sexual differences in PISA and TIMMS we see that they depend more on the context they are measured in than on gender itself. Certainly, there is considerable variability among nations which explains gender differences in test scores in terms of differences in social status and women’s welfare.

More recent studies (Lindberg, et al. 2010) support the hypothesis that there are no  differences in mathematical aptitude. It has to be mentioned that since measurement of the gap began, gender disparity in mathematical achievement has been decreasing. In a seminal meta-analysis by Hyde (1990) this tendency is observed. When we include more recent work such as the previously cited, we can confirm it. In other words, without a substantial change in human biology, we are achieving important changes in the results of both genders.
When we talk about so important a topic as the gender gap in technical degrees, the debate should center perhaps on social factors, evaluator prejudice, class competitiveness, or motivation. No more effort is required in the dubious sexual differences in mathematical aptitude.

Romanticismo educativo y desarrollo económico

Traducimos aquí un artículo del blog homónimo de Pseudoerasmus, en respuesta a dos artículos publicados en Politikon , originados a su vez a raíz de un cuarto artículo, de Ricardo Hausmann, donde cargaba contra la importancia de la educación en el desarrollo económico.

Por Pseudoerasmus

Link del texto original: http://pseudoerasmus.com/2015/06/15/education-econ-growth/
Junio 15, 2015

Una reflexión sobre el artículo de Ricardo Hausmann «The Education Myth«. Este post también comenta un post del blog grupal español Politikon, que critica las tesis de Hausmann.

El economista de Harvard Ricardo Hausmann publicó recientemente una columna en Project Syndicate titulada «The Education Myth«, argumentando que se ha sobrevalorado la educación como herramienta de desarrollo económico. Enfoca su crítica hacia lo que él llama la gente del «educación, educación, educación», del tipo que puedes encontrar en Davos y otros sitios donde se entonan tonterías con gran devoción. Pero creo que su argumento resulta esclarecedor sobre la habilidad de los países en vías de desarrollo de mejorar los resultados educativos.

La observación principal de Hausmann es esta: aquellos países que han triplicado los años medios de escolarización desde 2.8 años hasta 8.3 años entre 1960 y 2010 sólo lograron elevar su PIB por trabajador un 167%. Cita a Pritchett 2001, pero creo que un resumen más interesante puede encontrarse en el capítulo 11 del Handbook of the Economics of Education (Vol. 1) del propio Pritchett:

Durante esos 35 años, la desviación estándar mundial del PIB por trabajador aumentó, mientras que la desviación estándar de escolarización por trabajador se redujo. La desigualdad entre el percentil 90 y el percentil 10 de cada país en PIB por trabajador casi se duplicó, a pesar de que el ratio 90/10 de escolarización por trabajador mejoró dramáticamente. Si la educación es tan importante, esto es ciertamente un puzzle.

Por supuesto, comparar simplemente escolarización y crecimiento económico es sólo un mero argumento correlacional que omite los muchos otros determinantes del crecimiento. Pero Hausmann sólo está simplificando las cosas para una audiencia popular para poder transmitir un hallazgo sólido de la literatura empírica sobre crecimiento económico: la variable «años de escolarización» por sí misma apenas explica (tiene bajo poder explicativo) los niveles de crecimiento en el PIB por trabajador, ya sea en regresiones multi-país que incluyen los controles habituales, o en contabilidad del crecimiento, que trata de medir directamente la contribución del capital humano a los niveles de crecimiento de países individuales.

Pritchett 2001 no encuentra retornos sociales significativos de la escolarización en la mayoría de los países en vías de desarrollo – sin un gran impacto detectable más allá de la suma de los retornos privados a la educación. Esto es así a pesar de que dentro de cada país, aquellos con más escolarización tienden a tener mayor renta. La tabla siguiente para África es de Barro-Lee:

La tabla recoge resultados de contabilidad del crecimiento – identificar los inputs que entran en el proceso productivo (trabajo, capital, capital educativo) y compararlos con el output. El término residual o no explicado (TFP) se interpreta habitualmente como el crecimiento de la eficiencia con la que se emplean los inputs para generar outputs.

Lo que muestra la tabla para el África subsahariana es que aunque la contribución de la inversión educativa crecía enormemente, la contribución del capital y la TFP estaban colapsando en los años 70-90. Las relaciones aquí no son necesariamente causales. Pero si son causales, podrían implicar que los más educados estaban llevando a cabo actividades socialmente inútiles, como recibir sobornos como funcionarios en la oficina de aduanas a cambio de licencias de importación. Si las relaciones no son causales, entonces podrían implicar que la oferta de gente educada estaba aumentando, a pesar de que su demanda no estaba creciendo lo suficientemente rápido. O podría ser un poco de ambos.

Otra posibilidad es que todos esos años de educación estuviesen vacíos, i.e., que no implicasen ningún aprendizaje real ni ninguna adquisición de habilidades. Pritchett presenta cierta evidencia limitada de que esto no puede ser del todo cierto, e.g. la fertilidad de las mujeres con más escolarización cayó. Estudios de Barro-Lee (véase también su artículo en VoxEU) también hacen que esto sea improbable.

No obstante, el economista experto en trabajo y educación Eric Hanushek es bastante rotundo sobre esto: A pesar de enormes incrementos globales en los niveles de ingreso a la escuela y del número de años medios de asistencia a la escuela, «la mejor evidencia disponible muestra que muchos de los estudiantes no parecía aprender nada» [énfasis mío {Esto es, de Pseudoerasmus}]. Esta visión se basa en las bajas puntuaciones que obtienen los estudiantes de países en vías de desarrollo en evaluaciones internacionales:

[Fuente: Hanushek & Woessman, The Knowledge Capital of Nations: Education and the Economics of Growth. Las medias no transmiten toda la información, véase la distribución de puntuaciones, con 400 definido como «funcionalmente analfabeto».]

Así que, ¿Cuál es la mejor manera de interpretar el artículo de Hausmann?

  1. Sí, los años de escolarización son un mal proxy del posterior resultado educativo. Pero capturan muy bien los instrumentos políticos que los gobiernos pueden controlar fácilmente – construir grandes cajas y estabular a los niños en ellos como ganado. Esta inversión obviamente no ha causado una convergencia en las puntuaciones de los tests entre países desarrollados y en vías de desarrollo.
  2. No hay evidencia de que la educación, sea como sea que se mida, promueve los niveles de crecimiento que son necesarios para la eventual convergencia con los países ricos.
  3. Sin embargo, hay evidencia que sugiere que la educación ha contribuido a los niveles positivos pero relativamente bajos de crecimiento que han sido insuficientes para la convergencia. La literatura de crecimiento económico asume implícitamente que la rápida convergencia de Asia oriental con los países occidentales es ‘normal’, y que el lento crecimiento de otros países no-occidentales es ‘anormal’. Pero quizá lo primero sea la anomalía.

§  §  §

En el blog colectivo español Politikon, Roger Senserrich estaba básicamente de acuerdo con Hausmann. Pero dos otros Politikones, Octavio Medina y Lucas Gortázar plantearon una crítica del argumentario Hausmann-Senserrich. (Se estaban troleando unos a otros por diversión)

La objeción principal de Medina-Gortázar es que los «años de escolarización» son un mal proxy para la educación, así que ahora la calidad de la educación, en lugar de medidas de acceso a la escuela, es lo que se está empleando para estudiar la relación entre crecimiento económico y educación. «Lo que un niño aprende en su primer año de escuela primaria no es lo mismo en Kenia que lo que aprende un niño en Finlandia o Uruguay». Entonces Medina y Gortázar presentan un gráfico similar al expuesto a continuación para argumentar que sí, de hecho existe una relación entre crecimiento económico y «calidad de la educación»:

[Fuente: la publicación de la OECD “Universal Basic Skills” por Hanushek & Woessmann]

Por desgracia, el argumento de Medina-Gortázar también se basa en un mal proxy. La puntuación de PISA y TIMSS no es – repito, no es – un proxy para «calidad educativa». Reflejan el desempeño de los estudiantes. No deberían confundirse variables input institucionales como «calidad del profesorado» o «calidad de las escuelas», con variables de output como el desempeño de los estudiantes. Hanushek y Woessmann usan de forma consistente puntuaciones en estos tests como proxy de (en sus palabras) habilidades cognitivas. De la misma publicación de la OECD:

El énfasis en las habilidades cognitivas tiene un número importante de ventajas potenciales. Primero, recoge variaciones en el conocimiento y habilidad que las escuelas tratan de producir, y por tanto relaciona los outputs putativos de la escolarización con el posterior éxito económico. En segundo lugar, al enfatizar los resultados de la educación, recoge habilidades de cualquier fuente  -incluyendo familiares, escolares e innatas. Tercero, al estudiar diferencias de desempeño entre estudiantes cuya escolarización difiere en calidad (pero posiblemente no en cantidad), reconoce – e invita a una investigación de – el efecto de diferentes políticas en la calidad de las escuelas. [pg. 89]

Así que ¿Cuán optimistas deberíamos ser acerca de la habilidad de los países en vías de desarrollo para mejorar las puntuaciones en los tests? Sabemos que algunos países pobres han logrado hacerlo, e.g., la puntuación en PISA de Brasil ha subido cerca de una desviación y media estándar en la última década. Pero es más bien cuestión de si se puede cerrar la brecha entre países desarrollados y en vías de desarrollo, i.e., Brasil aún está más de una desviación estándar por debajo de la media de la OECD, lo que pone a la media del país por debajo de la categoría «funcionalmente analfabeto».

Hay una cadena causal que debe estudiarse. Debemos saber qué es lo que miden los tests de desempeño; si las escuelas «óptimas» pueden mejorar las puntuaciones en los tests hasta niveles aceleradores del crecimiento; y cuán factible es acercar al «óptimo» las malas escuelas de los países en vías de desarrollo.

§  §  §

Aunque los tests como PISA o TIMSS miden aprendizaje, implícita e indirectamente midan la habilidad de aprender, que es por lo que estos tests, junto con los SAT americanos están fuertemente correlacionados con el CI. (Véase Rindermann 2007 para las altas correlaciones de las medias de los países; y Frey & Detterman 2004 para la correlación a nivel individual de los SATs americanos. Y FYI, puedes ver la revisión de Bouchard 2004; versión de libre acceso. He extraído la Tabla 1, que contiene un resumen de los resultados.)

No quiero tratar la cuestión de la maleabilidad de la capacidad cognitiva, así que simplemente asumiré que en países en vías de desarrollo (1) Es más maleable dada la mayor variación ambiental y (2) la relación entre capacidad cognitiva y puntuaciones en tests de desempeño es lo suficientemente imperfecta para que en principio haya bastante capacidad de mejorar las puntuaciones.

Pero aquellos investigadores que han encontrado que las puntuaciones de los tests pueden incrementarse (en países desarrollados) normalmente enfatizan la importancia de intervenciones educativas de muy temprana edad. James Heckman, premio Nobel y célebre crítico de The Bell Curve, presenta el caso más sólido para el optimismo. Pero incluso él argumenta que el momento clave para intervenir y mejorar el desempeño académico (y otros resultados vitales) es sustancialmente anterior a la educación formal convencional. De Heckman:

Las brechas en las capacidades que juegan un importante papel a la hora de determinar la calidad de vida en adultos comienzan muy pronto entre grupos socioeconómicos. Las brechas se originan antes de que comience la educación formal y persiste durante la infancia y la adultez. Remediar los problemas creados por estas brechas no es tan efectivo como evitarlas desde un comienzo.

Por ejemplo, la escolarización desde segundo de primaria juega un papel menor en la creación o reducción de las brechas. Las medidas habituales de inputs educativos – el tamaño de la clase y el salario del profesorado – que reciben mucha atención en el debate público tienen efectos pequeños en la creación o eliminación de disparidades. Esto es sorprendente cuando uno piensa de la gran desigualdad en calidad educativa que existe e lo largo de los Estados Unidos, y especialmente entre las comunidades desaventajadas.

Mis colegas y yo hemos investigado esto. Controlamos por los efectos del entorno familiar temprano usando modelos estadísticos convencionales. Las brechas se redujeron notablemente. Esto es consistente con la evidencia del Informe Coleman (publicado en 1966) que muestra que las características familiares, y no las de las escuelas, explican gran parte de la variabilidad de las puntuaciones en tests en diferentes escuelas.

Heckman argumenta que mejorar el entorno familiar e implementar programas de educación preescolar muy temprana para infantes(!!!) es la manera más efectiva de mejorar el desempeño de los infantes. Son cosas que los países desarrollados, incluso con sus fuertes instituciones, pueden hacer difícilmente, si es que pueden hacerlo. Imagina para los países en vías de desarrollo, muchos de los cuales apenas consiguen el acceso universal a la educación.

§  §  §

Pero estoy dispuesto a creer que los países en vías de desarrollo pueden mejorar mucho más las puntuaciones en los tests a través de mejores escuelas. Esto es porque tener «escuelas» sobre el papel no implica necesariamente que esté teniendo lugar un proceso, siquiera rudimentario, de educación. Especialmente en algunos de los países más pobres, los problemas con la calidad educativa a veces incluyen la asistencia regular de los profesores, ausencia de libros de texto, o incluso de techos!

Pero, ¿Cómo mejorar la calidad de las escuelas? Aunque soy bastante escéptico de que los países con un nivel de renta medio se beneficien de un mayor gasto por estudiante, seguramente sí lo harán Afganistán o Burundi.

Glewwe et al. (2013) revisa estudios entre 1990 y 2010 sobre el impacto de una serie de inputs educativos sobre medidas de aprendizaje de los estudiantes (como puntuaciones de tests) en países en vías de desarrollo:

[La diferencia entre la segunda y tercera columnas (36) se refiere a los estudios que contienen OLS usando sólo datos transversales que, según los autores, no tratan bien variables omitidas, endogeneidad, auto-selección, etc. etc.]

El efecto incierto de incluso los inputs más básicos de infraestructuras, como los libros de texto, es sorprendente. Por otro lado, quizá haya cierta esperanza en reducir el ratio de alumnos por profesor, y el impacto del absentismo del profesorado no se ha estudiado mucho. Pero como dicen los autores, «quizá la conclusión más útil que podemos extraer para las políticas públicas es que hay escaso soporte empírico para un gran número de características de las escuelas y el profesorado que algunos observadores pueden ver como prioridades para el gasto escolar».

Por supuesto, ha habido una explosión en ensayos controlados aleatorizados (RCT) y estudios experimentales en países en vías de desarrollo en los últimos 10 años, así que en el futuro tendremos más evidencia. Pero cuando leo sobre el colapso de un experimento con incentivos financieros para reducir el absentismo de enfermeras (libre acceso) en hospitales indios, no soy muy optimista en cuanto a los enormes cambios institucionales que parecen ser necesarios para mejorar la calidad de las escuelas.

Cuáles son los consejos de Hanushek para los países en vías de desarrollo? Básicamente lo que ahora está de moda entre los círculos educativos en los Estados Unidos y otros países desarrollados:

  • Conseguir profesores más inteligentes (y someterles a tests)
  • Hacer un seguimiento a los estudiantes
  • Emplear exámenes de finalización de estudios
  • Descentralizar la toma de decisiones educativa

Hanushek de hecho argumenta que la «elección escolar», por sí misma, es una mala idea en países en vías de desarrollo y que podría incluso empeorar el desempeño de los estudiantes. Así que prefiere estas reformas combinadas, y su optimismo se refleja en proyecciones como esta, basada en correlaciones multi-país con muestras de 50 países, o lo que sea:

Bueno, Nepal y El Salvador, ¡Problema resuelto!

§  §  §

Aunque los retornos de la mejora de la calidad de las escuelas (manteniendo constante la matriculación de estudiantes) serían mayores que los de incrementar la matriculación y nivel educativo (manteniendo la calidad constante), esto segundo parece una opción más realista para la mayoría de los países en vías de desarrollo. A fin de cuentas, un país tan rico y de tamaño tan fácilmente manejable como Qatar apenas puede superar los 400 puntos! Y aún hay mucho espacio para incrementar el porcentaje de escolarizados y años de escolarización:

Y con esto volvemos al principio. Empezamos con la observación de Hausmann de que aumentar el acceso a las escuelas per se no ha hecho mucho. Pero a pesar de la baja productividad de las escuelas y de la alta probabilidad de que existan retornos decrecientes al aumentar inputs, quizá eliminar los problemas en las escuelas sea la oportunidad más factible para países en vías de desarrollo.

Nota: Gran parte de la literatura asume que las malas escuelas son una de las principales causas del bajo desempeño. Cuando hay profesores, libros y techos ausentes, esa puede ser una asunción razonable. Pero ¿Cuál es la evidencia? La cuestión de qué parte de la relación entre puntuaciones en tests y crecimiento económico es atribuible específicamente a la calidad de las escuelas, en contraposición a factores no-escolares que determinen puntuaciones en tests, se aborda en Hanushek & Woessmann 2012 (especialmente en la sección 5, versión de libre acceso). Se comparan las correlaciones entre niveles de crecimiento y medidas institucionales de escolarización (sistemas de exámenes post-escolares, el porcentaje de escuelas gestionadas de forma privada, la centralización de la toma de decisiones, etc., que se toman como exógenas) con las correlaciones entre puntuaciones en tests y niveles de crecimiento. Pero creo que gran parte de estas medidas institucionales están fuertemente correlacionadas con la capacidad cognitiva y las instituciones político/económicas. Los autores insisten en que los efectos de la escolarización sobreviven tras citar todo tipo de literatura, pero los tamaños de muestra son más bien pequeños, y no puedo afirmar a partir de lo que ellos dicen si sus conclusiones son también realmente aplicables a países en vías de desarrollo sin mirar otros papers que citan.

§  §  §

Nota del traductor: A lo anteriormente dicho, queremos añadir dos puntos de interés. El primero, señalar un artículo publicado aquí recientemente, donde apuntamos a la posible existencia de sesgos de publicación en la literatura de intervenciones infantiles tempranas para el caso de las habilidades cognitivas (Para las no cognitivas, que son las que enfatiza Heckman en sus trabajos recientes, no tenemos información para hacer crítica alguna).

El segundo, señalar que los resultados de Pritchett 2001 son consistentes con el análisis que el economista Bryan Caplan está haciendo  de los retornos privados y sociales de la educación en el caso de Estados Unidos. Él encuentra que los retornos sociales son negativos para varios tipos de estudiantes, asumiendo un modelo de signaling, donde gran parte de la educación es una externalidad negativa: los estudiantes no estarían realmente aprendiendo gran cosa, sino sólo gastando recursos en señalizar de forma costosa sus habilidades, generando ineficiencias. El estudio de Caplan no implica necesariamente idéntico resultado para países en vías de desarrollo: la naturaleza y efectos de la educación en países desarrollados y subdesarrollados, como apunta Pseudoerasmus, es diferente. Los datos pueden encontrarse aquí y una presentación introductoria aquí. O puedes escuchar este podcast.

Sesgos de publicación: El caso de los programas de educación pre-escolar

Existen estudios que dicen probar que los programas de educación pre-escolar de alta calidad tienen efectos destacables y duraderos sobre múltiples habilidades cognitivas y no cognitivas en los niños que asisten a estos programas. Algunos nombres de los ensayos célebres de este tipo de medidas son el Perry Preschool Program y el Abecedarian Program, y de forma más extensa, el Programa Head Start. En España, probablemente el sitio donde se les ha dado mayor publicidad a estos estudios es en Politikon. Así, podemos leer que

Sabemos, y hay una cantidad absolutamente descomunal de literatura para respaldarlo, que los primeros mil días en la vida de un niño son cruciales para su desarrollo cognitivo. El cerebro desarrolla su capacidad de aprendizaje entre los cero y tres años. […] debemos preocuparnos sobre el gasto de educación en primera infancia. Los estudios, de nuevo, respaldan esta afirmación: los programas de educación infantil producen mejoras claras y sostenidas en el desarrollo educativo de los niños, y generan retornos considerables a largo plazo en ingresos adicionales y movilidad social. Cuanto antes en la vida de un niño invirtamos el dinero, más efectiva será nuestra inversión. (Educación, inversiones y primera infancia. 2014)

Cada vez más los programas de primera infancia toman mayor importancia en el diseño de políticas públicas en todo el mundo. Sin embargo, aún hay mucho por mejorar. La ventana de oportunidad para este tipo de inversiones es muy corta y sus consecuencias durarán toda la vida. […] El hecho de que las brechas en habilidades se generen a edades tan tempranas implica que si no se hace nada al respecto en la primera infancia se estará perpetuando la desigualdad en las sociedades –tanto al interior como entre éstas. La ventana de oportunidad para las inversiones en primera infancia es muy corta y sus consecuencias durarán toda la vida. (¿Qué sabemos sobre el Desarrollo Infantil Temprano desde la economía? 2014 )

La literatura sobre el tema es muy clara: si queremos mejorar espectacularmente la igualdad de oportunidades y el futuro de los niños de renta baja en España, ninguna inversión tiene mejor retorno que la educación en primera infancia. James Heckman ha hablado largo y tendido sobre estos temas, y la evidencia empírica es abundante y clara. Estamos hablando de guarderías y centros de día de buena calidad para niños de cero a tres años, a ser posible universales y gratuitos. (Seis políticas para redistribuir renta. 2013)

Problemas con la evidencia

Sin embargo, la evidencia, si bien ciertamente es abundante, no es tan clara. Recientemente, en la London Conference on Intelligence, uno de los ponentes, Andrew Sabiski argumentó a en contra de políticas de apoyo a la primera infancia,y a favor de mejor esperar para evaluar las capacidades de cada niño o clase, y poder realizar intervenciones allí donde estas puedan tener más beneficios. Según Sabiski, los beneficios de la educación infantil están sobrevalorados.

Impacto de programas infantiles según fecha y precisión

En este gráfico podemos ver los resultados de un reciente meta-análisis (Duncan & Magnuson 2013) sobre programas de educación infantil y su impacto en habilidades cognitivas. En el eje de abscisas tenemos la fecha en la que se hizo el estudio, y en el de ordenadas, el efecto del mismo, medido en desviaciones estándar. El tamaño de las burbujas es inversamente proporcional al cuadrado del error estándar del programa. Esto es, burbujas más grandes corresponden a estudios más precisos. Podemos observar varias tendencias:

  • Según pasa el tiempo, la efectividad de los programas se va reduciendo. Los programas anteriores a 1980 producían un efecto de 0.33 desviaciones estándar, y esa cifra cae a 0.16 si consideramos los hechos desde entonces. Los autores se preguntan por qué esto es así, ya que esperarían que los efectos fuesen mejorando si lo que se aprende en unos estudios se pone en práctica en los siguientes. Duncan & Magnuson plantean que la mejora en las condiciones de los grupos de control han mejorado sustancialmente: Para el caso de las familias más pobres, apenas un 18% asistía a guardería en 1970, y esa cifra se ha elevado a algo más del 37% en 2010.
  • Los estudios de hace 40 años no son tan precisos como los actuales
  • Dos de los ejemplos usuales que suelen ponerse para ilustrar los beneficios de estas intervenciones son estudios antiguos, poco precisos, y outliers respecto al resto de estudios
  • Existen discrepancias sobre si estos programas tienen efectos sobre variables como criminalidad, comportamiento antisocial o problemas psicológicos.

Los autores se muestran entusiastas al respecto, haciendo una llamada a más y mejores estudios, pero al mismo tiempo, le dan el visto bueno a implementar ya estos programas. Pero dada esta evidencia, se pueden llegar a las conclusiones opuestas: antes de gastar dinero, es mejor saber que éste va a ser realmente efectivo (Armor 2014) Sin embargo, el propósito de este artículo no es tanto discutir sobre los costes y beneficios de estas intervenciones, sino sobre un problema existente en la literatura reflejada en el meta-análisis citado anteriormente: el sesgo de publicación.

Funnel plots: Estudiando estudios

Para ello, debemos presentar el concepto de funnel plot. Un funnel plot es un gráfico que recoge el tamaño del efecto encontrado por un estudio (sobre alguna variable arbitraria) y la precisión del estudio:

Funnel plot

Los estudios en ciencias sociales tienen el problema de no ser ni de lejos tan precisos como los de ciencias naturales, lo que da lugar a criterios de aceptación de resultados que si se juzgasen con los estándares de la Física serían risibles. Estos problemas metodológicos dan lugar a que existan estudios que afirmen una cosa y la contraria, o que presenten resultados dispares. Un ejemplo de esto podéis verlo en este vídeo, que introduce la problemática, relacionada, del uso de p-valores. Pero si se hacen muchos estudios, y los errores están distribuidos aleatoriamente, y además hay estudios con precisión diferente, podremos dibujarlos todos en una gráfica, y deberíamos observar cómo según aumenta la precisión, se produce una convergencia hacia un valor (el verdadero, se infiere) del efecto del estudio. Además, también debería observarse que el gráfico es simétrico.

De no serlo, y habiendo muchos estudios, puede ser señal de sesgos en publicación: datos cocinados que llevan a que los errores, en agregado, no estén distribuidos normalmente, sesgando la distribución de muestras normalmente al alza -por presiones internas al mundo académico, existen incentivos a inflar los resultados obtenidos, o a no publicar resultados negativos o nulos (Matosin et. al 2014) De aquí, dos puntos importantes: El primero, que encontrar un estudio que afirme algo no implica que ese algo sea cierto, especialmente en ciencias sociales. Y el segundo, que si vemos que la literatura sobre algún tema presenta un funnel plot así deberíamos sospechar de la existencia de sesgos de publicación.:

Funnel plot sesgado

Sesgo de publicación en educación pre-escolar

Con los programas de educación infantil, éste parece ser el caso. Garrett Jones y Emil O.W. Kirkegaard encontraron los datos tabulados del gráfico expuesto anteriormente, y Kirkegaard decidió representar su propio funnel plot con dichos datos, que recogemos a continuación:

Funnel plot para programas de educación infantil. Las líneas negras representan la media de los efectos de estudios grandes (línea continua) contra la de los pequeños (discontinua), mientras que las azules recogen la media, la mediana (discontinua) y la media ponderada (línea de puntos)

El mismo gráfico puede también verse añadiendo una correlación entre precisión y tamaño del efecto:

Correlación entre tamaño de efecto y precisión

Vemos que, primero, el gráfico está lejos de ser simétrico, que los resultados de estudios con poblaciones mayores son más cercanos a cero y que, aún con el sesgo, existe una correlación inversa entre precisión y tamaño de efecto.

Habilidades no cognitivas, una posible salida

En el metaanálisis diferencian entre habilidades cognitivas (g, generalmente) y no cognitivas (también The Need to address noncognitive skills in the education policy agenda):

Many early childhood education programs appear to boost cognitive ability and early school achievement in the short run. However, most of them show smaller impacts than those generated by the best-known programs, and their cognitive impacts largely disappear within a few years. Despite this fade-out, long-run follow-ups from a handful of well-known programs show lasting positive effects on such outcomes as greater educational attainment, higher earnings, and lower rates of crime. Since findings egarding short and longer-run impacts on “noncognitive” outcomes are mixed, it is uncertain what skills, behaviors, or developmental processes are particularly important in producing these longer-run impacts. (Duncan & Magnusson 2013)

La crítica anterior sólo aplica a los estudios revisados en el metaanálisis, donde se recogen sólo habilidades cognitivas. Desconocemos si este sesgo está presente también en esta otra literatura.

Conclusión

A la vista de esto, deberíamos ser más cautos a la hora de defender este tipo de intervenciones, y esperar a tener más información sobre las mismas o de forma más general, de afirmar que una ciencia social dice algo de forma rotunda si no hay un robusto meta-análisis detrás (Y aún en esos casos, puede seguir habiendo problemas: Existen metanálisis con los más altos niveles de rigor que prueban la existencia de fenómenos paranormales! (Bem et. al 2014). Para una explicación de esto, ver este excelente post en Slate Star Codex) Esto sólo ilustra la problemática que tiene afirmar que algo es el caso en ciencias sociales, y que se hace necesario elevar aún más los niveles de cuidado en este campo.

Es un tema para otra ocasión, pero sería interesante estudiar la conveniencia de aumentar los niveles de rigor que se les exige a las ciencias sociales para afirmar que han descubierto algo de forma rotunda. ¿Llevaría esto a un vacío epistémico de las ciencias sociales o por el contrario es un error exigirles lo que se le exige a la Física? Desde aquí nos apuntamos a la segunda opción, que va de la mano de la llamada a una mayor humildad a la hora de afirmar que la ciencia dice esto o aquello.

Bibliografía

Armor, D. J. (2014). The Evidence on Universal Preschool: Are Benefits Worth the Cost?.

Bem, D., Tressoldi, P. E., Rabeyron, T., & Duggan, M. (2014). Feeling the future: A meta-analysis of 90 experiments on the anomalous anticipation of random future events

Duncan, G. J., & Magnuson, K. (2013). Investing in preschool programs. The journal of economic perspectives: a journal of the American Economic Association, 27(2), 109.

Matosin, N., Frank, E., Engel, M., Lum, J. S., & Newell, K. A. (2014). Negativity towards negative results: a discussion of the disconnect between scientific worth and scientific culture. Disease models & mechanisms, 7(2), 171-173.

Recomendaciones (III)

  • En Alt-m, George Selgin contra un economista de la Fed sobre historia económica, free banking, y las razones históricas por las que aparecen bancos centrales. No os perdáis tampoco los comentarios de David Andolfatto.
  • En Economy.com , Adam Ozimek da un repaso a la historia de la literatura sobre el salario mínimo, sobre cómo han ido variando los enfoques empleados para estudiar los efectos de esta política sobre el empleo.
  • ¿Es válido hacer comparaciones interpersonales de utilidad? ¿Es la utilidad cardinal u ordinal? Sobre esto se debate en Econlog. Interesante complementar con este paper de Ken Binmore al respecto
  • Un estudio reciente sobre el debate de nature-nurture, que zanja la cuestión con meta-análisis de todos los estudios con gemelos de los últimos 50 años, para un total de tamaño muestral de 14.5 millones de parejas de gemelos. El resultado, la mitad de la varianza, de media, de diversas variables y enfermedades es explicable por diferencias genéticas. La genética importa para estudiar al ser humano, y este artículo no hace otra cosa que cimentar y robustecer esta conclusión, ya señalada por, entre otros, Pinker en The Blank Slate  (2002)
  • ¿Cual es el caso histórico más favorable para los pro-expansión fiscal como forma de «reactivar» la economía? Pues la Gran Depresión en EE.UU, a primera vista, parece tener muchos números de serlo. Recientemente, en el Journal of Economic History, se ha publicado un artículo de Price Fishback y Valentina Kachanovskaya donde estiman el tamaño del multiplicador durante el periodo mencionado: «We estimated a series of per capita income multipliers using different definitions of government spending. The IV income multiplier estimates ranged from 0.4 to 0.96 in level and first-difference analyses that control for state and year fixed effects.«
  • How private schools are serving the poorest: Pauline Dixon at TEDxGlasgow

Recomendaciones (II)

http://www.smbc-comics.com/index.php?db=comics&id=2781