Coder un fichier en ISCO-08

Coder un fichier en ISCO-08

Comme la PCS 2020, pour coder automatiquement un fichier en ISCO-08, il faut disposer de données comprenant les informations nécessaires en collecte (libellé de profession, normalement collecté dans la liste ; variables « annexes ») et utiliser le tableur contenant l’ensemble des règles de codification.

Dans ce tableur, également appelé matrice de codification, les libellés de profession sont en ligne, les combinaisons des variables annexes en colonne et les codes de profession ISCO-08 au croisement des lignes et des colonnes.


Les instruments (listes de professions, matrice de codification, tables de codage) permettant de classer les professions dans la nomenclature ISCO-08 ont vocation à évoluer chaque année pour prendre en compte des améliorations. Ces instruments sont donc millésimés. Ainsi, par exemple, les listes de libellés de professions 2024 correspondent aux versions des listes embarquées dans les enquêtes de l’Insee en 2024.

Matrice de codification ISCO-08, à consulter ou télécharger

Télécharger

En pratique, la codification automatique suppose :

  1. d’avoir un fichier comprenant cinq variables : le libellé de profession, et quatre variables (STATUT, CPF, TAILLE et ENCADRE) issues des questions utilisées en collecte ;
  2. puis, de lui appliquer un programme pour normaliser les libellés de professions, arbitrer les éventuelles incohérences entre variables et retourner le codage en ISCO-08.


Un exemple de tels programmes, édités avec les logiciels statistiques SAS, R et Python peuvent être consultés ou téléchargés ci-dessous.


Dans certains cas, l’information ne permet pas d’obtenir un codage complet (qui correspond à un des 436 codes à quatre positions de l’ISCO-08) : le code se termine alors par autant de zéro qu’il faut enlever pour avoir le niveau de précision du codage ; dans la mesure où la nomenclature utilise le code « 0 » pour les militaires, un libellé non codé aura pour code « 9900 ».


Le taux de codification automatique dépend du taux de libellés appartenant à la liste de libellé, qui dépend lui-même du mode de collecte du recueil de l’information. Les enquêtes informatisées collectées par enquêteurs offrent le plus de garantie d’avoir un taux de codification automatique élevé.

Programme SAS de codification automatique ISCO-08, à consulter ou télécharger

Télécharger

Programme R de codification automatique ISCO-08, à consulter ou télécharger

Télécharger

Programme Python de codification automatique ISCO-08, à consulter ou télécharger

Télécharger

Les libellés non codés automatiquement peuvent être codés à l’unité, complètement ou partiellement. Il s’agit de rapprocher le libellé déclaré d’un libellé de la liste, ou à défaut de trouver directement un code de ISCO 08, en mobilisant éventuellement des informations contextuelles (par exemple le libellé de secteur d’activité).

Vous pouvez consulter ou télécharger ci-dessous un document précisant les consignes de reprise manuelle d’ISCO-08 après codification en PCS 2020.


À l’Insee, la codification manuelle d’ISCO-08 se fait dans la continuité de la reprise de la PCS 2020 : les gestionnaires de reprises, qui disposent d’outils dédiés, sont spécifiquement formés pour coder ISCO-08 en utilisant au mieux le codage PCS 2020. Ce protocole réduit au maximum le surcoût de codification de la nomenclature internationale par rapport à la nomenclature française. 

Consignes de reprise manuelle de l'ISCO-08, à consulter ou télécharger

Télécharger

nomenclature-pcs / site actualisé en décembre 2023