Les objectifs du PGH original n'étaient pas seulement de séquencer l'ensemble des 3 milliards de paires de bases du génome humain avec un taux d'erreur minimal, mais aussi d'identifier tous les gènes dans cette grande quantité de données. Cette partie du projet n'est pas encore finie malgré un compte préliminaire indiquant environ 25000 gènes dans le génome humain, ce qui est beaucoup moins que prévu par la plupart des scientifiques.
En 1995, les différents scientifiques à la tête du projet de séquençage du génome humain se retrouvent pour une réunion aux Bermudes sous l'égide du Wellcome Trust. Ils prennent deux décisions politiques majeures qui vont influencer le cours du projet. Tout d'abord, ils décident du caractère public du génome, qui est considéré comme patrimoine de l'humanité. Tout fragment de séquence déchiffré doit être immédiatement publié sur Internet. Ensuite, l'objectif de précision finale est fixé à 99,99 % soit au plus une erreur tous les 10 000 nucléotides
Un autre but du PGH était de développer des méthodes plus rapides et efficaces pour le séquençage de l'ADN et l'analyse des séquences, ainsi que de transférer ces technologies à l'industrie. Entre 1989 et 2001, le débit de la technologie de séquençage s'est améliorée d'environ un facteur 100. Ceci est dû en particulier à l'utilisation de traceurs fluorescents, de lasers et de séparation par électrophorèse capillaire.
Un autre aspect critique a été l'amélioration considérable des performances des ordinateurs qui ont permis l'assemblage des dizaines de millions de fragments individuels d'ADN qui ont été décodés un par un.
La séquence de l'ADN humain est stockée dans des bases de données consultables par n'importe qui sur Internet. Le Centre National Étasunien pour l'Information sur les Biotechnologies (U.S. National Center for Biotechnology Information) (ainsi que des organisations sœurs en Europe et en Asie) accueille la séquence du gène dans une base de données connue sous le nom de Genbank, avec des séquences de gènes et de protéines connus et hypothétiques. D'autres organisations comme l'Université de Californie à Santa Cruz et ENSEMBL présentent des données additionnelles ainsi que des notes, et met à la disposition des outils pour les visualiser et les rechercher. Des programmes informatiques ont été développés pour analyser la séquence, car les données brutes sont difficiles à interpréter seules.
Le processus permettant d'identifier les limites entre les gènes et d'autres caractéristiques sur la séquence d'ADN brute est appelé annotation du génome, et appartient au domaine de la bio-informatique. Alors que des experts biologistes constituent les meilleurs annotateurs, leur capacité de traitement est limitée et les programmes informatiques sont de plus en plus utilisés pour répondre aux immenses besoins de traitement de données des projets de séquençage génomique.
Tous les humains ont des séquences de gène uniques, donc les données publiées par le PGH ne représentent pas la séquence exacte du génome individuel de chaque individu. C'est le génome combiné d'un petit nombre de donneurs anonymes. Le génome du PGH est un échafaudage pour un futur travail consistant à identifier les différences entre les individus. La plus grande partie du travail actuel pour identifier les différences entre les individus concerne des polymorphismes nucléotidiques simples (ou SNP pour Single nucleotide polymorphism)