Il existe plusieurs variantes du lemme de Zorn, les unes portent sur les conditions que doit vérifier l'ensemble ordonné, pour posséder un élément maximal : on peut les voir comme des variantes sur la définition d'ensemble inductif, qui n'est d'ailleurs pas entièrement fixée dans la littérature, même si, dans ce contexte celle donnée ci-dessus reste la plus courante. D'autres variantes restreignent le lemme de Zorn à un ensemble de parties d'un ensemble muni de l'inclusion, restrictions qui s'avèrent en fait facilement équivalentes à l'énoncé initial.
En un sens précisé ci-dessous, un ensemble non vide partiellement ordonné sera dit inductif si toute partie non vide « au moins totalement ordonnée » admet un « majorant ou mieux ». Les candidats usuels pour préciser « au moins totalement ordonnée » sont :
tandis que ceux pour « majorant ou mieux » sont
d'où quatre définitions voisines mais distinctes, la moins restrictive correspondant à (2,3) et la plus restrictive à (1,4). Comme l'acception la plus courante correspond au cas du couple (1,3), nous l'avons pris comme définition (à noter que l'existence d'un majorant de la chaîne vide équivaut simplement à ce que l'ensemble soit non vide) :
Pour beaucoup d'applications du lemme de Zorn la définition (1,4), qui est la plus restrictive, s'utilise naturellement, même si elle donne un énoncé en apparence plus faible. C'est le cas par exemple de l'application à la comparabilité cardinale du paragraphe précédent : la réunion des éléments de la chaîne n'est pas seulement un majorant mais une borne supérieure. La notion peut aussi être utile dans d'autres contextes. Un ensemble non vide tel que toute chaîne non vide admet une borne supérieure (choix (1,4)) est parfois appelé, ensemble strictement inductif, mais on trouve également la dénomination d'ensemble inductif sans autre précision.
C'est bien-sûr la définition la moins restrictive qui donne le meilleur énoncé du lemme de Zorn. Même si l'énoncé habituel correspond au choix du couple (1,3) dans la définition d'ensemble inductif, le couple (2,3) donne un énoncé (apparemment) plus fort, parfois bien utile.
Le lemme de Zorn peut se particulariser pour la relation d'inclusion sur un ensemble d'ensembles. Un candidat naturel pour le majorant d'une chaîne pour l'inclusion est la réunion des éléments de cette chaîne. Il s'agit alors forcément de la borne supérieure de la chaîne. On obtient ainsi comme conséquence du lemme de Zorn l'énoncé suivant, qui lui est en fait équivalent, et qui est l'énoncé de l'article de 1935 de Max Zorn :
Lemme de Zorn pour l'inclusion — Si un ensemble non vide d'ensembles est tel que la réunion de toute chaîne non vide pour l'inclusion d'éléments de est encore un élément de , alors possède un élément maximal pour l'inclusion.
Pour l'application à la comparabilité cardinale (voir ci-dessus), on était déjà dans ce cas particulier ( est l'ensemble des graphes d'injections partielles de E dans F). C'est en fait un cas particulier de la version (1,4) du lemme de Zorn. On a un énoncé analogue en termes de chaînes bien ordonnées par l'inclusion (cas particulier de la version (2,4)), qui est l'énoncé de l'article de 1922 de Kuratowski.
Si (E, ≤) est un ensemble ordonné, l'ensemble des chaînes de E (pour l'ordre de E) est lui même un ensemble ordonné par inclusion. Si
Principe de maximalité de Hausdorff — Tout ensemble ordonné contient une chaîne (c'est-à-dire un sous-ensemble totalement ordonné) maximale pour l'inclusion (c'est-à-dire qui n'est contenue strictement dans aucune chaîne).
Si de plus l'ensemble ordonné est inductif (au sens initial (1,3)), la chaîne maximale en question possède un majorant, qui est forcément un plus grand élément de la chaîne, et de l'ensemble lui même (sinon on pourrait prolonger la chaîne qui ne serait pas maximale pour l'inclusion). On déduit donc le lemme de Zorn (version (1,3) initiale) du principe de Hausdorff. On a donc démontré l'équivalence des énoncés du lemme de Zorn pour des chaînes totalement ordonnées (versions (1,3), (1,4), lemme de Zorn pour l'inclusion et principe de Hausdorff).
On peut également déduire les versions du lemme de Zorn pour les chaînes bien ordonnées (versions (2,3) et (2,4)) du principe de maximalité de Hausdorff. Cependant, pour l'ordre de l'inclusion, une chaîne de chaînes bien ordonnées n'a pas nécessairement de borne supérieure. On les compare par segment initial : soit un ensemble ordonné (E, ≤), on dit, pour deux chaînes bien ordonnées de (E, ≤) C1 et C2, que C1 est un segment initial de C2 quand :
On vérifie facilement que la relation « être un segment initial » est une relation d'ordre sur l'ensemble des chaînes bien ordonnées de E, tel que tout ensemble non vide
On peut donc déduire du lemme de Zorn habituel (ou même version (1,4)) que l'ensemble des chaînes bien ordonnées d'un ensemble ordonné (E, ≤) possède une chaîne bien ordonnée maximale pour l'ordre par segment initial. Si on suppose maintenant que (E, ≤) est un ensemble inductif au sens (2,3) (le plus restreint), c'est-à-dire que tout chaîne bien ordonnée de (E, ≤) possède un majorant, on a alors un majorant m pour une chaîne bien ordonnée de E maximale pour l'ordre par segment initial. Ce majorant m est nécessairement un élément maximal de E, car, si ça n'était pas le cas, un élément strictement supérieur à ce majorant permettrait de prolonger la chaîne maximale en une chaîne bien ordonnée, dont la chaîne maximale serait alors un segment initial, ce qui contredit la maximalité.
On a donc démontré (indépendamment des résultats du paragraphe précédent) que le lemme de Zorn pour la définition d'ensemble inductif (1,4), le plus faible en apparence, a pour conséquence le lemme de Zorn pour la définition d'ensemble inductif (2,3), le plus fort en apparence. Les quatre énoncés sont donc bien équivalents.