Artículos panorámicos

La jerarquía de conmutatividad

Fotografía: Imelda Paredes
Omar Antolín Camarena

Resumen

Del álgebra estamos acostumbrados a dividir las operaciones binarias en conmutativas y no conmutativas, pero en la teoría de categorías se descubrió que se necesitaba una tercer opción intermedia. Y la cosa no para ahí: en la teoría de homotopía se definió una jerarquía infinita de niveles de conmutatividad que generalizan los del álgebra y la teoría de categorías.

  • Palabras clave: conmutatividad, categorías monoidales, espacios iterados de lazos, óperads

Introducción

¿Qué tan conmutativa puede ser una operación binaria? A primera vista la pregunta no tiene mucho sentido, pues la conmutatividad parece ser una proposición binaria, una cuestión de todo o nada: una operación o es conmutativa o no lo es. En el álgebra tenemos ejemplos familiares: un grupo es abeliano o no lo es y un anillo es conmutativo o no lo es.

Desde luego, uno puede inventar maneras de cuantificar la conmutatividad; por ejemplo, en un grupo finito \(G\) podemos calcular la probabilidad de que dos elementos elegidos uniformemente al azar conmuten: \[c(G) := \frac{\left|\{(x,y) \in G^2 : xy=yx\}\right|}{\left| G \right|^2}.\]

Un resultado de teoría de grupos muy simpático e inesperado, y que es un buen ejercicio demostrar (pero para arruinar el ejercicio, véase [Gus73]), dice que si \(c(G) > \frac{5}{8}\) entonces \(G\) debe ser abeliano. El grupo de cuaternios de orden 8, \(Q_8 = \{\pm 1, \pm i, \pm j, \pm k\}\), tiene \(c(Q_8) = \frac{5}{8}\).

Pero aunque hay algunos resultados interesantes de este tipo cuantitativo, no son de lo que trata este artículo. Aquí la tirada es describir una lista discreta e infinita de «niveles de conmutatividad» que se originó en la teoría de homotopía y que tiene usos en la teoría de categorías.

Conmutatividad en conjuntos

Empecemos por recordar algunas de las estructuras algebraicas más simples: los monoides. Un monoide es un conjunto \(M\) equipado de una operación binaria \(M \times M \to M\) asociativa y con elemento neutro. La operación se llama la multiplicación del monoide y tradicionalmente se denota por yuxtaposición, \((a,b) \mapsto ab\). Que la multiplicación sea asociativa significa que \((ab)c = a(bc)\) para cualesquiera elementos de \(M\).

Un monoide conmutativo es simplemente un monoide cuya operación binaria es conmutativa, o sea, que cumple \(ab = ba\) para cualquier par de elementos del monoide.

Advertencia: En la definición de monoide también es importante el comportamiento del elemento neutro, pero lo dejaremos de lado para concentrarnos en la operación binaria. Lo mismo haremos más adelante con la unidad de las categorías monoidales y otras estructuras similares. Esto se hace con la intención de simplificar la exposición y no para insinuar que las unidades no son importantes o que no tienen sus sutilezas.

Mirando críticamente estas definiciones uno podría preguntarse por qué los monoides conmutativos siguen siendo asociativos, o más correctamente (dado que la respuesta a esa pregunta es obviamente «por definición»), ¿por qué no estudiamos también las operaciones binarias conmutativas pero no necesariamente asociativas? Probablemente la respuesta a esa pregunta es de hecho que sí se estudian, pero no es controvertido decir que la experiencia nos indica que son menos importantes que los monoides conmutativos. Pero quizá haya una razón más profunda que la evidencia empírica para pedir asociatividad acompañando a la conmutatividad. Como una muestra enigmática de esa posibilidad, ofrecemos una pequeña excursión por la geometría proyectiva.

Conmutatividad en geometría proyectiva plana

En la geometría proyectiva plana uno puede tomar el enfoque axiomático y definir un plano proyectivo abstracto como un conjunto de puntos, un conjunto de rectas, y una relación entre puntos y rectas llama incidencia satisfaciendo las siguientes condiciones:

  • Dados dos puntos distintos, existe una única recta incidente con ambos.
  • Dados dos rectas distintas, existe un único punto incidente con ambas.
  • Existen cuatro puntos no colineales, es decir, tales que no hay una recta incidente con todos ellos.
Los ejemplos más familiares de planos proyectivos abstractos son los que se obtienen empezando con un campo arbitrario \(K\) y declarando que los puntos y rectas son los subespacios de dimensión 1 y 2 en \(K^3\), respectivamente, y que un punto incide con una recta precisamente cuando es un subespacio lineal de ella. El plano proyectivo así obtenido se llama \(K\mathbb{P}^2\).

No todos los teoremas de la geometría proyectiva plana que se conocen en el caso clásico de \(\mathbb{RP}^2\) son válidos en planos proyectivos abstractos arbitrarios. Entre estos teoremas destacan dos:

El teorema de Desargues. Si \(ABC\) y \(A'B'C'\) son dos triángulos (tercias de puntos no colineales), las rectas \(AA'\), \(BB'\) y \(CC'\) concurren si y sólo si los tres puntos \(AB \cap A'B'\), \(BC \cap B'C'\), \(CA \cap C'A'\) son colineales.
El teorema de Pappus. Si \(ABC\) y \(A'B'C'\) son dos tercias de puntos colineales, los puntos \(AB \cap A'B'\), \(BC \cap B'C'\), \(CA \cap C'A'\) son colineales también.

Y aquí sucede un fenómeno interesante (ver [Art16]):

  • El teorema de Pappus se vale en un plano proyectivo abstracto, si y sólo si ese plano es de la forma \(K\mathbb{P}^2\) para algún campo \(K\).
  • El teorema de Desargues se vale en un plano proyectivo abstracto, si y sólo si ese plano es de la forma \(K\mathbb{P}^2\) donde ahora \(K\) denota no un campo, sino un anillo de división.

Los anillos de división se definen de manera muy parecida a los campos, sólo que sin pedir que la multiplicación sea conmutativa, en particular, la multiplicación en los anillos de división es asociativa. El ejemplo más conocido de un anillo de división que no es campo, es el anillo de los cuaternios. La construcción del plano proyectivo \(K\mathbb{P}^2\) cuando \(K\) es un anillo de división es muy similar a la que describimos arriba para un campo \(K\).

En resumen, el teorema de Desargues corresponde a la asociatividad y el teorema de Pappus a conmutatividad más asociatividad.

Por cierto, como cualquier campo es un anillo de división, los resultados mencionados arriba nos dicen que en cualquier plano proyectivo abstracto en donde se vale el teorema de Pappus, el teorema de Desargues también debe valerse. Más brevemente, el teorema de Pappus implica al teorema de Desargues. Es un buen ejercicio dar una demostración geométrica directa de este hecho.

Conmutatividad en categorías

¿Por qué en el álgebra tradicionalmente la pregunta de si una operación es conmutativa se responde solamente «sí» o «no»? Una explicación es que las estructuras algebraicas son conjuntos, y en un conjunto dos elementos sólo tienen opciones para relacionarse: o son iguales o son diferentes; así que \(ab = ba\) o \(ab \neq ba\) y para \(a\) y \(b\) esas son todas las posibilidades.

Sin salir completamente del álgebra hay otro contexto donde dos cosas se pueden relacionar de muchas maneras: dos objetos en una categoría pueden ser isomorfos o no y cuando son isomorfos puede haber muchos isomorfismos entre ellos. Así que dada una operación binaria \(\otimes\) en una categoría, podemos pedir que \(\otimes\) venga equipada con un isomorfismo \(\sigma : A \otimes B \xrightarrow{\cong} B \otimes A\). Esto hace que la conmutatividad ya no sea una propiedad sino una estructura y es el primer paso para que haya varios tipos de conmutatividad.

Pero nos estamos adelantando. Empecemos por definir con cuidado una operación asociativa en una categoría.

Categorías monoidales

Una categoría monoidal \(\mathcal{C}\) es una categoría equipada con un funtor \(\otimes : \mathcal{C} \times \mathcal{C} \to \mathcal{C}\), llamado usualmente producto tensorial o tensor, y con estructura adicional que está de testigo de la asociatividad de \(\otimes\) (y de la existencia de una objeto neutro \(I \in \mathcal{C}\), pero, como ya advertimos, esto no lo discutiremos mucho). Esa estructura adicional consta de un isomorfismo \(\alpha_{A,B,C} : (A \otimes B) \otimes C \to A \otimes (B \otimes C)\) para cualesquiera \(A, B, C \in \mathcal{C}\). Esta familia de isomorfismos \(\alpha = \{\alpha_{A,B,C}\}_{A, B, C \in \mathcal{C}}\) necesita ser natural en cada variable por separado —natural es un término técnico de la teoría de categorías, pero no necesitaremos su definición en lo que sigue.

El isomorfismo natural \(\alpha\) no es arbitrario, sino que debe satisfacer una ecuación conocida como el pentágono de MacLane: \[(1_A \otimes \alpha_{B,C,D}) \circ \alpha_{A, B \otimes C, D} \circ (\alpha_{A,B,C} \otimes 1_D) = \alpha_{A, B, C \otimes D} \circ \alpha_{A \otimes B, C, D}.\]

El nombre pentágono tiene más sentido cuando expresamos la ecuación en forma de diagrama conmutativo como se ve en la figura 1.

El pentágono de MacLane. Omitimos el símbolo \(\otimes\) para abreviar.

¿Por qué se pide que \(\alpha\) satisfaga este axioma pentagonal? Una vez que uno nota que con \(\alpha\) se pueden construir esos dos isomorfismos entre \(((A \otimes B) \otimes C) \otimes D\) y \(A \otimes (B \otimes (C \otimes D))\), suena muy razonable pedir que de hecho sean iguales, después de todo, el punto de la asociatividad es que los productos de varios factores se vuelvan no ambiguos y si bien a nivel categórico no podemos esperar que esos dos objetos sean el mismo (¡ni siquiera en la categoría de conjuntos con el producto cartesiano lo son!), al menos quisiéramos no preocuparnos por escoger cuál isomorfismo entre esos objetos vamos a usar.

Pero una vez habiendo aceptado ese axioma, ¿cómo sabemos que cumple su cometido y quita toda la ambigüedad en isomorfismos entre distintas maneras de colocar paréntesis? Después de todo, el análogo de eso sucedía para monoides: una vez que pedíamos \((ab)c=a(bc)\), obteníamos «gratis» que \((ab)(c(d((ef)g))) = (a(bc))((de)(fg))\) y todas las demás igualdades de ese estilo. Es un buen ejercicio formalizar (y demostrar) esta propiedad; curiosamente, ésto rara vez se hace explícitamente en los cursos de álgebra de licenciatura —o al menos eso cree el autor.

En el caso de las categorías monoidales, lo que respalda la elección del pentágono como único axioma (bueno, más los que hablan del neutro) es el teorema de coherencia de MacLane [Mac63]. Informalmente dice que cualquier diagrama construido usando sólo identidades, componentes de \(\alpha\) y el producto tensorial automáticamente conmuta.

Ejemplos de categorías monoidales

Hay muchos ejemplos familiares de categorías monoidales:

  • En cualquier categoría que tenga una noción de producto cartesiano o producto directo, digamos \(\times{}\), podemos tomar \(\otimes = \times\). El isomorfismo \(\alpha\) usualmente es obvio. Esto incluye las categorías de conjuntos, espacios topológicos, grupos, grupos abelianos, categorías, etcétera. Las categorías monoidales en las que el producto tensorial es el producto cartesiano, se conocen como categorías cartesianas.
  • Como ejemplo no cartesiano cabe mencionar la categoría de grupos abelianos con el producto tensorial \(\otimes\) de grupos abelianos. Generalizando, para cualquier anillo conmutativo \(R\) podemos tomar la categoría de \(R\)-módulos con el producto tensorial sobre \(R\), denotado \(\otimes_R\).

Todos esos ejemplos son, de hecho, categorías monoidales simétricas (así se llama la conmutatividad en este contexto), que definiremos en la siguiente sección. No es difícil dar un ejemplo no simétrico: dada cualquier categoría \(\mathcal{C}\), la categoría de funtores de \(\mathcal{C}\) en sí misma, \(\mathrm{End}(C)\) es monoidal si tomamos \(\otimes\) como la composición (aquí \(\alpha\) de hecho es la identidad). La composición de funtores usualmente no es conmutativa, al igual que la composición de funciones no lo es —de hecho, la composición de funtores generaliza a la composición de funciones.

Categorías monoidales simétricas

Una categoría monoidal simétrica es una categoría monoidal equipada adicionalmente con un testigo de la conmutatividad del tensor: un isomorfismo natural \(\sigma\) con componentes \(\sigma_{A,B} : A \otimes B \xrightarrow{\cong} B \otimes A\). Al igual que sucede con la asociatividad, \(\sigma\) no es arbitraria sino que debe satisfacer algunos axiomas.

Uno de ellos es fácil de explicar: \(\sigma\) permite intercambiar dos factores en un producto tensorial, y si intercambiamos el mismo par de factores dos veces seguidas eso debería ser lo mismo que no hacer nada: \(\sigma_{B,A} \circ \sigma_{A,B} = 1_{A\otimes B}\). El otro axioma es más complicado y se conoce como el hexágono de MacLane, ver figura 2.

El hexágono de MacLane.

Aquí, todas las flechas están dadas esencialmente por aplicar \(\sigma\) a dos factores consecutivos. Más formalmente, el producto \(XYZ\) denota, digamos, \((X \otimes Y) \otimes Z\) y entonces podemos aplicar \(\sigma\) a los primeros dos factores usando \(\sigma_{X,Y} \otimes 1_Z\), pero para aplicárselo a los últimos necesitamos usar \(\alpha\) también: \(\alpha_{X,Z,Y}^{-1} \circ (1_X \otimes \sigma_{Y,Z}) \circ \alpha_{X,Y,Z}\).

De nuevo hay un teorema de coherencia, también de MacLane [Mac63], que nos dice que este axioma basta para que los isomorfismos de permutar factores que podemos construir con \(\sigma\) son únicos.

Categorías monoidales trenzadas

¡Y ahora por fin llegamos a un grado de conmutatividad nuevo! Resulta que podemos simplemente quitar la condición \(\sigma_{B,A} \circ \sigma_{A,B} = 1_{A\otimes B}\) de la definición de categoría monoidal simétrica para obtener otro concepto útil: el de categoría monoidal trenzada. (Bueno, casi se obtiene la definición de categoría monoidal trenzada: al quitar la condición de \(\sigma^2 = 1\), necesitamos dos versiones del hexágono, una zurda y una diestra).

Estas categorías monoidales trenzadas tienen un grado de conmutatividad intermedio entre las categorías monoidales, donde el tensor sólo es asociativo, y las categorías simétricas monoidales, que tienen un tensor «lo más conmutativo posible» en categorías.

El desarrollo histórico justifica pensar que el concepto de categoría monoidal trenzada es de algún modo más «avanzado» que el de categoría monoidal o categoría simétrica monoidal. Mientras que el artículo de Saunders MacLane en que prueba los teoremas de coherencia mencionados arriba es de 1963, la definición de categoría monoidal trenzada no se dio sino hasta los ochenta: por una parte André Joyal y Ross Street [JS86] dieron la definición en 1986 (ver también [JS93]) e independientemente Lawrence Breen [Bre88] propuso la misma definición en una carta a Pierre Deligne en 1988.

No es tan fácil dar ejemplos de categorías monoidales trenzadas que no sean simétricas. Tal vez el ejemplo más importante es la categoría de representaciones de un grupo cuántico (que, confusamente, no es un grupo sino un álgebra de Hopf que se obtiene al deformar el álgebra universal envolvente de un álgebra de Lie).

Quizás la manera más rápida de conseguir un poco de intuición sobre los distintos tipos de categorías monoidales es considerar la categoría libre de cada uno de esos tres tipos generadas por un objeto \(A\). Para simplificar las cosas, consideraremos más precisamente las categorías monoidales libremente generadas por un objeto en las que el isomorfismo de asociatividad \(\alpha\) es la identidad; así nos estaremos concentrando en el papel de \(\sigma\).

Si una categoría monoidal tiene un objeto \(A\), ¿qué más debe tener? Pues tiene \(A \otimes A =: A^2\), \(A \otimes A \otimes A =: A^3\), etcétera. Además está el objeto neutro \(I = A^0\), claro. Y en cualquiera de las tres categorías libres que estamos considerando todos esos objetos son no isomorfos dos a dos porque nada los obliga a lo contrario. La diferencia entre los tres tipos se ve al preguntarnos qué morfismos deben tener estas categorías libres.

  • En la categoría monoidal libre generada por \(A\) nada nos obliga a tener otro morfismo, así que no lo tenemos.
  • En la categorías monoidales trenzadas y simétricas generadas por \(A\), debemos tener \(\sigma : A^2 \to A^2\). En el caso de la simétrica, \(\sigma^2 = 1\), así que \(\mathrm{Hom}(A^2, A^2) \cong \mathbb{Z}/2\). En cambio en el caso de la trenzada, nada obliga a \(\sigma\) a tener orden finito y resulta que \(\mathrm{Hom}(A^2, A^2) \cong \mathbb{Z}\). En general en la simétrica, \(\mathrm{Hom}(A^n, A^n) \cong \Sigma_n\), el grupo simétrico en \(n\) letras, mientras que en la trenzada, \(\mathrm{Hom}(A^n, A^n) \cong B_n\), el grupo de trenzas de \(n\) hebras. Desde luego, de ahí viene el nombre de las categorías monoidales trenzadas.

¿Cómo podíamos haber predicho estas definiciones?

Estas definiciones pueden parecer un poco complicadas. Ciertamente no es obvio que los axiomas presentados son suficientes; esta justificado por los teoremas de coherencia que no son triviales. Por otra parte sería razonable tener la duda ahora: ¿ya tenemos todas los grados posibles de conmutatividad para un producto tensorial en una categoría?, ¿no será que nos faltan definiciones por encontrar?

Inspiraría más confianza tener una máquina que nos diga cuales grados de conmutatividad hay en tal o cual contexto, que le preguntemos, «¿qué hay de operaciones binarias en conjuntos?» y nos conteste, «sólo hay dos nociones»; pero que si preguntamos por categorías nos diga que son tres nociones, y no sólo eso, que nos dé definiciones equivalentes a las de categorías monoidales, monoidales trenzadas y monoidales simétricas.

En lo que queda del artículo, describiremos una máquina capaz de hacer eso, que proviene de la teoría de homotopía.

Espacios de lazos

En teoría de homotopía hay un fenómeno simple de «grados de conmutatividad» muy conocido: el grupo fundamental de un espacio basado puede ser no abeliano, pero los grupos de homotopía superiores siempre son abelianos. Esto es el principio de la jerarquía de conmutatividad, pero tomará un poco de tiempo explicarlo.

Recordemos que dado un espacio topológico \(X\) con un punto distinguido \(x_0\), definimos \(\pi_n(X,x_0)\) como el conjunto de clases de homotopía relativas a los puntos base de funciones continuas basadas \(S^n \to X\); alternativamente podemos definir \(\pi_n(X,x_0)\) como el conjunto de clases de homotopía relativas a la frontera de funciones continuas \([0,1]^n \to X\) que mandan \(\partial [0,1]^n\) a \(x_0\). (Se vuelve un poco cansado mencionar constantemente los puntos base, así que dejaremos de hacerlo, pero todos los espacios de los que hablemos serán basados y sólo consideraremos aplicaciones envíen puntos base en puntos base).

Es bien conocido que mientras \(\pi_1(X)\) puede ser un grupo completamente arbitrario, los \(\pi_n(X)\) para \(n \ge 2\) siempre son abelianos. De hecho, Eduard Čech definió los grupos de homotopía superiores y probó sus propiedades básicas en un artículo para el Congreso Internacional de Matemáticas de 1932. Se supone que a Paul Alexandroff y a Heinz Hopf les pareció que no podían ser muy interesantes precisamente por ser abelianos y convencieron a Čech de no publicar su artículo, de modo que sólo hay una mención muy breve en las memorias del congreso. No fue sino hasta unos años después que Witold Hurewicz continuó el estudio de los grupos de homotopía.

Los grupos de homotopía sólo vienen en dos grados distintos de conmutatividad porque son simplemente grupos, pero eso es culpa de la operación de tomar clases de homotopía. ¿Qué pasa si no identificamos aplicaciones homotópicas? Empecemos con lazos, por ejemplo. Al conjunto de todos los lazos, usualmente denotado \(\Omega X\), se le puede dotar de la topología compacto-abierta, cuya definición precisa no importa aquí. Lo que importa es sólo que cada lazo en \(X\) es un punto del espacio \(\Omega X\) y una homotopía entre dos lazos corresponde a una trayectoria entre los correspondientes puntos de \(\Omega X\), de modo que \(\pi_1(X) = \pi_0(\Omega X)\). La multiplicación en el grupo \(\pi_1(X)\) está dada por concatenar lazos que representen las clases que se quieren multiplicar. Esta operación de concatenación nos da una operación binaria \(\Omega X \times \Omega X \to \Omega X\), que al aplicar \(\pi_0\) nos devuelve la multiplicación del grupo fundamental.

Aquí sucede algo como lo que pasó en categorías: la concatenación de lazos no es exactamente asociativa pero los dos productos \((\alpha \beta) \gamma\) y \(\alpha (\beta \gamma)\) son algo análogo a isomorfos. Si \(\alpha, \beta : [0,1] \to X\) son dos lazos que empiezan y terminan en \(x_0\), su concatenación se define reparametrizando como sigue: \((\alpha \beta)(t) = \alpha(2t)\) si \(t \in [0, \frac{1}{2}]\) y \((\alpha \beta)(t) = \beta(2t-1)\) si \(t \in [\frac{1}{2},1]\). Es fácil ver que dados tres lazos, \((\alpha \beta) \gamma\) casi nunca es igual a \(\alpha (\beta \gamma)\): en el primero \(\alpha\) se recorre en un intervalo de longitud \(\frac{1}{4}\), mientras que en el segundo en un intervalo de longitud \(\frac{1}{2}\). Pero también es fácil ver que \((\alpha \beta) \gamma\) y \(\alpha (\beta \gamma)\) son homotópicos; por eso es que la multiplicación en \(\pi_1(X)\) es asociativa.

Hasta hay un análogo del pentágono de MacLane. Tomemos cuatro lazos, \(\alpha, \beta, \gamma, \delta\) y pensemos en el pentágono \(P\) como un pentágono de verdad, un subespacio del plano. Podemos definir una función \(p : \partial P \times [0,1] \to X\) de modo que para cada arista \(A\) del pentágono, la restricción de \(p\) a \(A \times [0,1] \cong [0,1]^2\) sea una homotopía de asociatividad como las que mencionamos en el párrafo anterior. El análogo topológico del axioma del pentágono de MacLane es que la concatenación de las restricciones de \(p\) a tres de las aristas es homotópica a la concatenación de las restricciones de \(p\) a las otras dos. Una manera de demostrar este análogo del axioma del pentágono es dar una extensión de \(p\) a todo el interior del pentágono, es decir, a una función \(\tilde{p} : P \times [0,1] \to X\).

Y aquí es donde las cosas empiezan a diferir de la historia de las categorías monoidales. Para las categorías monoidales el pentágono de MacLane era una igualdad entre morfismos, y dados dos morfismos paralelos en una categoría o son iguales o no. Ahora en lugar de la igualdad, tenemos una homotopía \(\tilde{p}\) y en principio puede haber muchas de ellas. De hecho, la \(\tilde{p}\) se puede elegir de manera que cumpla su propio «axioma». El testigo de que se cumple ese axioma será una nueva homotopía y ésta a su vez cumplir otra condición atestiguada por otra homotopía y así sucesivamente. La situación se resume diciendo que la concatenación de lazos es asociativa salvo un sistema de homotopías coherentes. Para explicar esto, hablaremos de los asociaedros de Stasheff.

En la figura 3 se pueden observar, colocadas en los vértices de un poliedro, las distintas maneras de asociar la concatenación de cinco lazos. Ese poliedro se llama el asociaedro de Stasheff \(K_5\). Hay un asociaedro \(K_n\) de dimensión \(n-2\) para toda \(n \ge 2\). En dimensión 2, \(K_4\) es el pentágono \(P\).

El asociaedro \(K_5\). Imagen por Niles Johnson.

Las aristas de \(K_5\) corresponden a maneras de reasociar tres lazos. Hay dos tipos de caras: las pentagonales corresponden a maneras de reasociar productos de cuatro factores; además hay unas caras que son cuadriláteros (otro ejercicio: ¿ésas a qué corresponden?).

James Stasheff [Sta63a], [Sta63b] definió los asociaedros y los usó para definir los espacios \(A_{\infty}\). Un espacio \(A_{\infty}\) consta de un espacio \(Y\), y para cada \(n\) una función continua \(\mu_n : K_n \times Y^n \to Y\) que cumplen axiomas que no enunciaremos. Stasheff demostró que los espacios \(A_\infty\) captan justamente el tipo de asociatividad que tienen los espacios de lazos. Más precisamente probó que a cualquier espacio de lazos \(Y = \Omega X\) se le puede dar una estructura canónica de espacio \(A_{\infty}\) y casi viceversa: dado \(Y\), un espacio \(A_{\infty}\), \(\mu_2\) induce una estructura de monoide en \(\pi_0(Y)\), y si ese monoide resulta ser un grupo entonces hay un espacio \(X\) tal que \(Y\) es homotópicamente equivalente a \(\Omega X\). Esa condición de que \(\pi_0(Y)\) sea grupo es obviamente necesaria, pues si \(Y \simeq \Omega X\), entonces \(\pi_0(Y) \cong \pi_1(X)\).

Espacios de lazos iterados y óperads

Después de los resultados de Stasheff hubo mucho interés en probar caracterizaciones análogas para los espacios de lazos iterados. Como \(\Omega X\) es de nuevo un espacio basado (en el lazo constante \(x_0\)), podemos iterar \(\Omega\) para obtener una sucesión de espacios \(\Omega^{n+1}(X) := \Omega(\Omega^n(X))\). Equivalentemente podemos describir \(\Omega^n(X)\) como el espacio de aplicaciones basadas \(S^n \to X\), o como el espacio de aplicaciones \([0,1]^n \to X\) que mandan todo \(\partial [0,1]^n\) al punto base de \(X\). Estos espacios producen los grupos de homotopía superiores, a saber, \(\pi_0(\Omega^n X) = \pi_n(X)\). Un espacio de la forma \(\Omega^n(X)\) se conoce como un espacio de lazos \(n\)-uple (para \(n=2\), doble, para \(n=3\), triple, etcétera).

Como cada \(\Omega^n X\) es un espacio de lazos, concretamente el espacio de lazos de \(\Omega^{n-1} X\), viene con una operación binaria dada por la concatenación de lazos. Como sabemos que los \(\pi_n(X)\) con \(n \ge 2\) son grupos abelianos, esta operación binaria no sólo es asociativa sino que algún tipo de conmutatividad debe tener. Para caracterizar exactamente qué clase de conmutatividad tienen los espacios de lazos \(n\)-uples Peter May inventó la teoría de óperads y específicamente los óperads de cubitos.

Óperads

Un óperad \(O\) consiste de:

  • una sucesión de espacios \(\{O(n)\}_n\), cuyos puntos los pensamos como operaciones de \(n\) argumentos,
  • una acción del grupo simétrico \(\Sigma_n\) sobre \(O(n)\), que dice qué operación se obtiene al permutar los argumentos de otra, y
  • operaciones \(O(n) \times O(k_1) \times O(k_2) \times \cdots \times O(k_n) \to O(k_1 + k_2 + \cdots + k_n)\) que llamaremos composición.

La intuición tras el dominio y codominio de las operaciones de composición que se piden en el tercer inciso arriba, es que los puntos de \(O(n)\) son «como» funciones de \(n\) variables. Y dadas \(f, g \in O(2)\) y \(h \in O(3)\), por ejemplo, pensamos en \(f\) como una función \((x,y) \mapsto f(x,y)\), etcétera, y en la composición \(f \circ (g,h) \in O(5)\) como \((u,v,x,y,z) \mapsto f(g(u,v), h(x,y,z))\).

Estos datos deben satisfacer una colección de axiomas que (1) es un poco tedioso de escribir, pero que (2) no son difíciles de adivinar si uno piensa en los puntos de \(O_n\) como funciones de \(n\) variables y en cómo se componen las funciones de varias variables. Por ejemplo, cuando \(n=1=k_1\), la composición \(O(1) \times O(1) \to O(1)\) deberá ser asociativa. Los detalles de esta definición (¡y de las que siguen!) se pueden encontrar en [May89].

Los óperads existen para considerar álgebras sobre ellos. Una \(O\)-álgebra \(X\) es un espacio \(X\) en el que los puntos de \(O_n\) se realizan como aplicaciones \(X^n \to X\), es decir, \(X\) está equipado de funciones continuas \(\alpha_n : O_n \times X^n \to X\) —así, cada punto \(\theta \in O_n\) produce la aplicación \(X^n \to X\) dada por \((x_1, x_2, \ldots, x_n) \mapsto \alpha_n(\theta, x_1, x_2, \ldots, x_n)\). Las acciones de los grupos simétricos y las operaciones de composición en el óperad \(O\) deben corresponder a permutar los argumentos de las aplicaciones \(X^n \to X\) y a la composición de ellas, respectivamente.

Aquí hablamos de óperads en espacios topológicos, pero hay una generalización obvia y útil a óperads en cualquier categoría simétrica monoidal \(\mathcal{C}\). Ahora los \(O_n\) son objetos de \(\mathcal{C}\) y todos los usos de \(\times\) en los párrafos anteriores, se reemplazan con el tensor \(\otimes\) de \(\mathcal{C}\). Aparte de los óperads en espacios topológicos, probablemente las más importantes son los óperads en complejos de cadenas, como se estudian en [LV12] (ver también [MSS07] para información sobre óperads en general).

Los óperads de cubitos

Fijemos una dimensión \(d\). El óperad de cubitos de dimensión \(d\), \(\mathbb{E}_d\), tiene como espacio de operaciones de \(n\) argumentos el espacio \(\mathbb{E}_d(n)\) de encajes rectilíneos de la unión ajena de \(n\) copias del cubo \([0,1]^d\) en \([0,1]^d\). Es decir, cada punto de \(\mathbb{E}_d(n)\) es una función continua inyectiva \(\coprod^n [0,1]^d \to [0,1]^d\) que restringido a cada uno de los \(n\) cubitos es lineal en cada coordenada. Podemos representar un encaje rectilíneo simplemente dibujando las imágenes de los cubitos (y numerándolas, para saber cuál es la imagen de cuál cubito). Por ejemplo, la figura 4 representa un punto en \(\mathbb{E}_2(3)\).

Un punto en \(\mathbb{E}_2(3)\).

Este óperad fue creada para que un espacio de la forma \(\Omega^d X\) automáticamente fuera un \(\mathbb{E}_{d}\)-álgebra. Para definir una estructura de \(\mathbb{E}_d\)-álgebra necesitamos dar aplicaciones \(\mathbb{E}_d(n) \times (\Omega^d X)^n \to \Omega^d X\). Pensemos en \(\Omega^d X\) como el espacio de aplicaciones \([0,1]^d \to X\) que envían todo \(\partial [0,1]^d\) a \(x_0\). Entonces está claro cómo dado un \(\theta \in \mathbb{E}_d(n)\), y \(n\) aplicaciones \(\lambda_1, \ldots, \lambda_n : [0,1]^d \to X\) construir una nueva \([0,1]^d \to X\): simplemente usamos \(\lambda_i\), apropiadamente reescalada, en el \(i\)-ésimo cubito de \(\theta\), y enviamos el resto de \([0,1]^d\), lo que está fuera de todos los cubitos, a \(x_0\).

Así, cada espacio de lazos \(n\)-uple es un \(\mathbb{E}_d\)-álgebra. Y, como en el caso de los espacios \(A_{\infty}\) que discutimos antes, casi se cumple el recíproco: si \(Y\) es un \(\mathbb{E}_d\)-álgebra, entonces la aplicación \(\mathbb{E}_d(2) \times Y \times Y \to Y\) induce una estructura de monoide en \(\pi_0(Y)\), y si ese monoide resulta ser un grupo, entonces existe un espacio \(X\) tal que \(Y\) es homotópicamente equivalente a \(\Omega^d X\). De nuevo, la condición de que \(\pi_0(Y) \cong \pi_d(X)\) sea un grupo, es necesaria.

Esta caracterización de los espacios de lazos iterados, se conoce como el principio de reconocimiento y es uno de los teoremas principales de [May89]. Nótese que para \(d=1\) nos da una caracterización de espacios de lazos muy del estilo de la de Stasheff pero un poco diferente. Podemos decir que los espacios \(A_{\infty}\) son equivalentes a las \(\mathbb{E}_1\)-álgebras.

Ésta es finalmente la jerarquía de conmutatividad: en el nivel \(d\) están las \(\mathbb{E}_d\)-álgebras, que podemos pensar que corresponden a espacios con una operación binaria que es exactamente tan conmutativa como la concatenación de lazos en un espacio \(d\)-uple de lazos.

Bueno, hay un nivel más: hay un óperad \(\mathbb{E}_{\infty}\) que se forma tomando la unión de todas las \(\mathbb{E}_d\) (identificando cada cubo \([0,1]^d\) con \([0,1]^d \times \{0\} \subset [0,1]^{d+1}\)). Las \(\mathbb{E}_\infty\)-álgebras son la cima de la jerarquía de conmutatividad y tienen las operaciones más conmutativas.

Revisitando monoides y categorías monoidales

¿Pero cómo usamos esta jerarquía de conmutatividad, que es para espacios topológicos, en otros contextos? ¿Cómo podemos usarla para adivinar cuántos grados de conmutatividad tienen los monoides y cuántos las categorías monoidales?

Para eso la clave está en generalizar un poco la noción de álgebra para un óperad \(O = \{O(n)\}_n\). Como dimos las definiciones, \(O(n)\) es un espacio, así que es muy razonable que un \(O\)-álgebra \(X\) sea también un espacio, para que tenga sentido hablar de aplicaciones \(O(n) \times X^n \to X\). Ahora queremos tomar álgebras en otras categorías simétricas monoidales \(\mathbb{C}\). Para eso proponemos sustituir \(X^n\) por \(X^{\otimes n} = X \otimes \cdots \otimes X \in \mathcal{C}\), pero necesitamos también sustituir el producto de \(O(n)\) con la potencia de \(X\).

Para eso supondremos que tenemos un funtor \(\mathsf{C} : \mathsf{Top} \to \mathcal{C}\) para convertir espacios topológicos en objetos de \(\mathcal{C}\). Necesitaremos también que este funtor convierta productos de espacios en el producto tensorial de \(\mathcal{C}\): \(\mathsf{C}(X \times Y) \cong \mathsf{C}(X) \otimes \mathsf{C}(Y)\). Una vez elegido un funtor definimos una estructura de \(O\)-álgebra en un objeto \(X \in \mathcal{C}\) a través de morfismos \(\mathsf{C}(O(n)) \otimes X^{\otimes n} \to X\) en \(\mathcal{C}\).

Ya casi nos podemos preguntar: ¿cuáles son las \(\mathbb{E}_d\)-álgebras en la categoría \(\mathsf{Con}\) de conjuntos? Sólo nos falta definir un funtor que preserve productos \(\mathsf{C} : \mathsf{Top} \to \mathsf{Con}\). Afortunadamente hay uno canónico: \(\pi_0\). Y, ¿qué es un \(\mathbb{E}_d\)-álgebra en \(\mathsf{Con}\)? Esto es un excelente ejercicio, y saber la respuesta no lo arruina: para \(d=1\) resultan ser simplemente monoides, y para cualquier \(d \ge 2\) resultan ser monoides conmutativos. (El primer paso es verificar que \(\mathbb{E}_1(n)\) tiene \(n!\) componentes conexas y que \(\mathbb{E}_d(n)\) es conexo para \(d \ge 2\)). Así que reproducimos la pequeña jerarquía de conmutatividad que teníamos para operaciones binarias en conjuntos.

Para \(\mathsf{Cat}\), la categoría de categorías, ¿qué funtor \(\mathsf{C} : \mathsf{Top} \to \mathsf{Cat}\) que preserve productos podemos tomar? De nuevo hay uno canónico: el grupoide fundamental. Dado un espacio \(X\) su grupoide fundamental es una categoría que reúne todos los grupos fundamentales de \(X\) con distintos puntos base en un sólo paquete: \(\pi_{\le 1}(X)\) es la categoría cuyos objetos son puntos de \(X\) y cuyos morfismos son clases de homotopía relativa a los extremos de trayectorias en \(X\), la composición está dada por concatenar trayectorias. Es fácil convencerse de que \(\pi_{\le 1} : \mathsf{Top} \to \mathsf{Con}\) preserva productos, así que lo podemos usar para definir \(\mathbb{E}_d\)-álgebras en \(\mathsf{Cat}\).

Y como ya se imaginarán, resulta que un \(\mathbb{E}_d\)-álgebra en \(\mathsf{Cat}\) es: para \(d=1\), una categoría monoidal, para \(d=2\) una categoría monoidal trenzada y para cualquier \(d \ge 3\), es una categoría monoidal simétrica. La máquina produce por nosotros, como prometimos, todos los grados conmutatividad para categorías monoidales.

Referencias

Art16
Emil Artin Geometric Algebra Courier Dover Publications 2016.
Bre88
Lawrence Breen Une lettre à P. Deligne au sujet des 2-catégories tressées 1988.
Gus73
W. H. Gustafson What is the Probability that Two Group Elements Commute? The American Mathematical Monthly 80 9 (1973), 1031-1034. http://www.jstor.org/stable/2318778
JS86
André Joyal y Ross Street Braided monoidal categories Mathematics Reports 86008 (1986).
JS93
André Joyal y Ross Street Braided tensor categories Advances in Mathematics 102 1 (1993), 20-78.
LV12
Jean-Louis Loday y Bruno Vallette Algebraic operads Springer Science & Business Media 2012.
Mac63
Saunders MacLane Natural associativity and commutativity Rice Institute Pamphlet-Rice University Studies 49 4 (1963).
May89
J.P. May The Geometry of Iterated Loop Spaces Springer Berlin Heidelberg 1989.
MSS07
Martin Markl, Steven Shnider y James D Stasheff Operads in algebra, topology and physics American Mathematical Soc. 2007.
Sta63a
James Dillon Stasheff Homotopy Associativity of H-Spaces. I Transactions of the American Mathematical Society 108 2 (1963), 275-292. http://www.jstor.org/stable/1993608
Sta63b
James Dillon Stasheff Homotopy Associativity of H-Spaces. II Transactions of the American Mathematical Society 108 2 (1963), 293-312. http://www.jstor.org/stable/1993609
Omar Antolín Camarena
Instituto de Matemáticas, Universidad Nacional Autónoma de México (UNAM)
Motivos Matemáticos es una publicación electrónica del Instituto de Matemáticas, UNAM
© 2017