Analyse sémantique latente - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Analyse sémantique latente probabiliste (PLSA)

Le modèle statistique de l'analyse sémantique latente ne correspond pas aux données observées : elle suppose que les mots et documents forment ensemble un modèle gaussien (c'est l'hypothèse ergodique), alors qu'on observe une distribution de Poisson.

Ainsi, une approche plus récente est l'analyse sémantique latente probabiliste, ou PLSA (de l'anglais : Probabilistic latent semantic analysis), basée sur un modèle multinomial.

Limitations

Les limites de LSA incluent :

  • Celles du modèle sac de mots, sur lequel elle est basée, où le texte est représenté comme un ensemble non ordonné de mots.
  • L'impossibilité (dans le modèle de base) de prendre en compte la Polysémie (c'est-à-dire les sens multiples d'un mot), car un mot ne correspond qu'à un seul point de l'espace sémantique.
Page générée en 0.084 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise