Origines du paradoxe
La démonstration du paradoxe de Russell repose sur un argument diagonal, elle est très semblable à la démonstration du théorème de Cantor : le cardinal de l'ensemble des parties d'un ensemble (infini) E est strictement plus grand que celui de cet ensemble. Rappelons que pour démontrer ce théorème, on montre qu'une fonction f de E dans P(E), l'ensemble des parties de E, ne peut être surjective. En effet B = {x ∈ E | x ∉ f(x)} n'appartient pas à l'image de f : sinon pour un certain y, B=f(y), et y ∈ f(y) ⇔ y ∉ f(y), ce qui mène à une contradiction.
Cela rend impossible l'existence d'un plus grand cardinal. Or le cardinal de l'« ensemble » de tous les ensembles ne peut être que le plus grand cardinal. Plus précisément, l'« ensemble » de tous les ensembles contiendrait son ensemble des parties, et donc serait de cardinal supérieur ou égal à celui-ci.
Russell a déclaré qu'il était arrivé au paradoxe qui porte son nom en analysant soigneusement le paradoxe de Cantor. D'ailleurs, il peut paraître naturel pour un ensemble de ne pas appartenir à lui-même. Si l'on introduit un axiome qui interdit à un ensemble de s'appartenir à lui même (comme l'axiome de fondation), cela ne résout pas le paradoxe : si une théorie est contradictoire, toute théorie obtenue en ajoutant des axiomes le sera également. On peut toujours définir l'ensemble {x| x ∉ x} des ensembles qui n'appartiennent pas à eux-mêmes, qui dans ce cas devient l'ensemble de tous les ensembles.
Les solutions du paradoxe
Les principales solutions apportées pour éluder ce paradoxe furent :
- La restriction du principe de compréhension, due à Zermelo (1908) : un prédicat ne définit pas un ensemble mais sépare, dans un ensemble déjà donné, les objets qui ont une certaine propriété. Il est possible d'écrire le prédicat « x ∉ x », mais celui-ci ne définit plus un ensemble. Il peut définir un sous-ensemble d'un ensemble donné, mais cela ne conduit pas à un paradoxe (voir ). Il est nécessaire, pour développer les mathématiques, d'introduire un certain nombre d'autres instances du principe de compréhension général comme axiomes particuliers (paire, réunion, ensemble des parties, ...). Plus tard Abraham Fraenkel et Thoralf Skolem introduisirent (indépendamment) le schéma d'axiomes de remplacement, qui est toujours une restriction du principe de compréhension général, mais étend encore le schéma d'axiomes de compréhension introduit par Zermelo. Ils précisèrent également la notion de prédicat, et, en particulier Skolem, le contexte logique (le calcul des prédicats du premier ordre).
- la théorie des types de Russell, esquissée en appendice de l'ouvrage déjà cité de 1903. Russell la développe véritablement dans un article de 1908 (voir références). Il poursuit, en compagnie de Whitehead, avec les Principia Mathematica parus en 1910. Selon cette théorie, les ensembles sont de types hiérarchisés. À un ensemble ne peuvent appartenir que des objets, qui peuvent être des ensembles, mais sont de types strictement inférieurs au type de l'ensemble initial, de sorte qu'on ne peut tout simplement plus écrire l'énoncé paradoxal (on ne peut plus écrire le prédicat d'auto-appartenance « x ∈ x », a fortiori sa négation). Russell n'a pas immédiatement développé la théorie des types après 1903. Il a d'abord pensé à des solutions alternatives, comme la théorie « pas de classe », qu'il tente d'esquisser dans son article de 1906. Dans ce même article, Russell ne cite d'ailleurs même pas la théorie des types parmi les solutions qu'il a explorées.