SPSS - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

SPSS
Logo de SPSS
Développeur SPSS Inc.
Dernière version 18.0 (Win), 18.0 (Mac) (2009) [+/−]
Environnement Mac, Linux, Windows
Type Logiciel de statistiques
Licence propriétaire
Site Web www.spss.com/fr/

SPSS (Statistical Package for the Social Sciences) est un logiciel utilisé pour l'analyse statistique. C'est aussi le nom de la société qui le revend (SPSS Inc). En 2009, la compagnie décide de changer le nom de ses produits en PASW, pour Predictive Analytics Software et est rachetée par IBM pour 1,2 milliards de dollars.

Description

La première version de SPSS a été mise en vente en 1968 et fait partie des programmes les plus largement utilisés pour l'analyse statistique en sciences sociales. Il est utilisé par des chercheurs en économie, en science de la santé, par des compagnies d'études, par le gouvernement, des chercheurs de l'éducation nationale, et bien d'autres. En plus de l'analyse statistique, la gestion des données (sélection de cas, reformatage de fichier, création de données dérivées) et la documentation des données (un dictionnaire de métadonnées est sauvegardé avec les données) sont deux autres caractéristiques du logiciel.

Les nombreuses caractéristiques de SPSS sont accessibles via les menus déroulants ou peuvent être programmées avec un langage en ligne de commande appelé 4GL (licence propriétaire). La programmation par lignes de commande a les avantages de la reproductibilité et de la manipulation et de l'analyse de données complexes. L'interface des menus déroulants génère également une syntaxe de commandes, bien que, par défaut, elle soit invisible à l'utilisateur. Les programmes peuvent être lancés de manière interactive ou de façon non surveillée en utilisant le "Production Job Facility" fourni. Un langage de macro peut être utilisé pour écrire des routines et une extension pour le langage python permet d'accéder aux informations dans les données ou dans le dictionnaire des données et de construire des programmes en syntaxe de ligne de commande de façon dynamique. Cette extension de programmation Python, introduite dans la version 14, a remplacé les scripts SAX Basic moins fonctionnels pour la plupart des besoins, bien que SaxBasic reste disponible. Depuis la version 14, SPSS peut être piloté extérieurement en utilisant un programme en Python ou en VB.NET en utilisant les "plug-ins" fournis.

SPSS impose des contraintes concernant la structure interne des fichiers, les types des données, le traitement des données et les fichiers de correspondance, ce qui en fin de compte simplifie considérablement la programmation. Les séries de données de SPSS ont une structure en tableau à deux dimensions où les rangées représentent typiquement les cas (tels des individus ou des foyers) et où les colonnes représentent les mesures (telles que âge, sexe, ou revenu du foyer). Il n'y a que deux types définis de données : nombres ou chaines de caractères. Tous les traitements de données se déroulent de façon séquentielle les cas à la suite les uns des autres dans l'ordre du fichier. Les fichiers peuvent être comparés un à un, un envers les autres, mais pas plusieurs d'un coup envers les autres.

Différentes versions de SPSS existent pour Windows, Mac OS X et Unix. La version pour Windows est mise à jour plus fréquemment et possède plus de caractéristiques que les versions pour les autres systèmes d'exploitation. SPSS Inc. a annoncé que la mise sur le marché de la version 15.1 de SPSS en 2007 tournera de façon native sur ordinateur Mac muni de processeur Intel x86.

SPSS peut lire et écrire des données à partir et dans des fichiers texte en caractères ASCII (incluant les fichiers hiérarchiques), d'autres paquetages statistiques, des feuilles de calcul et des bases de données (des tables de base de données relationnelles externes via ODBC et SQL).

Les exportations statistiques se font dans un format propriétaire (fichiers *.spo, acceptant les tableaux croisés dynamiques) pour qui, en plus de l'afficheur du logiciel, un afficheur indépendant est fourni. On peut aussi demander que les exportations soient forcées en format texte (lisible avec un éditeur de texte) ou capturées en tant que données (en utilisant la commande OMS) au format texte, texte délimité par des séparateurs, HTML, XML, paquets de données SPSS ou une variété de formats d'images (JPEG, PNG, bitmap et EMF).

Fonctions statistiques incluses dans le logiciel de base :

  • Statistique descriptive : Cross tabulation, Fréquences, Descriptives, Explore, Descriptive Ratio Statistics
  • Statistique bivariée : Moyennes, test t, ANOVA, Corrélation (bivariée, partielle, distances), tests non paramétriques
  • Prédiction pour numérique outcomes: régression linéaire
  • Prédiction pour groupes identifiants: analyse de facteur, analyse de groupe (deux pas, moyenne K, hiérarchique), analyse discriminante (en marketing)

Des modules peuvent être ajoutés pour augmenter les possibilités du logiciel. Les modules disponibles sont :

  • l'extension de programmabilité SPSS ("SPSS Programmability Extension" (ajouté dans la version 14) qui permet la programmation en Python pour contrôler SPSS.
  • la validation de données SPSS ("SPSS Data Validation") (ajouté dans la version 14) qui permet la programmation du contrôle de la logique des données et donne la liste des valeurs suspectes.
  • les modèles de régression SPSS ("SPSS Regression Models" - Logistic regression, ordinal regression, multinomial logistic regression, and mixed models (modéles multiniveaux).
  • les modèles avancés SPSS ("SPSS Advanced Models" - Multivariate GLM and repeated measures ANOVA (enlevés de la version de base dans la version 14).
  • le module des arbres de classification SPSS ("SPSS Classification Trees") qui crée des arbres de classification et de décision pour l'identification de groupes et la prévision de comportements.
  • les tableaux SPSS ("SPSS Tables"), qui permettent de contrôler la manière d'effectuer les exportations de données pour les rapports.
  • les tests exacts SPSS ("SPSS Exact Tests") permettant le test statistique sur de petits échantillons.
  • les catégories SPSS ("SPSS Categories")
  • SPSS Trends™
  • SPSS Conjoint
  • l'analyse de valeur manquante SPSS ("SPSS Missing Value Analysis") qui est une imputation simple à base de régression.
  • SPSS Map
  • le module des échantillons complexes SPSS ("SPSS Complex Samples") (ajouté dans la version 12) qui réalise des ajustement pour la stratification et le groupage et autres biais de choix d'échantillon.

SPSS Server est une version de SPSS avec une architecture client/serveur qui possède des caractéristiques non disponibles dans les versions pour PC fixes. Un exemple est la fonction de score.

Page générée en 0.238 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise