Modélisation du Mix marketing

Contexte :

Il s’agit de construire un modèle permettant de simuler les conséquences de décisions sur le niveau du mix marketing pour un produit existant à partir des données d’un panel distributeur (Iri, Nielsen, pour les produits de grande consommation dans la grande distribution généraliste GMS, GfK pour les biens durables).

La modélisation est faite par circuit : sur les supermarchés (SUPER ou SM) et sur les hypermarchés (Hyper ou HM).

Les composantes du mix sont :

  • Le produit : le nombre de produit dans la gamme
  • La communication publicitaire : les dépenses effectuées
  • Les opérations de communication promotionnelles (principalement celles en magasin) qui combinent un ou plusieurs des éléments suivants :
    • Mise en avant (MEA) en tête de gondole dans le magasin, ou de manière autonome en îlot de masse (IM)
    • Mise sur un prospectus
    • Les réductions de prix
  • Le prix de base du produit.

Cependant seul l’information sur le prix net payé est collectée. Il faut donc séparer par un calcul le « prix de base » et la « réduction de prix ».

Une première approche des effets promotionnels est effectuée par différence entre les ventes observées et les « ventes de base » (baseline) qui sont les ventes qui auraient été réalisées sans la promotion.

Les modèles de mix

1. Modélisation des quantités

Les quantités sont expliquées par :

  • le mix du produit
  • les composantes du mix des concurrents qui ont un effet significatif sur les ventes du produit
  • les effets saisonniers (par la création de variables auxiliaires (dummy variable) binaires (0/1)

Un modèle de régression linéaire est ajusté, en utilisant des procédures automatiques de sélection des variables : pas à pas (stepwise) ou ascendante/descendante.

Les principales hypothèses de la régression doivent être vérifiées concernant les résidus (écart entre le prévu et le réel) :

  • Normalité des résidus ;
  • Non auto-corrélation des résidus ;
  • Stabilité de la variance des résidus (homoscédasticité) : pas de lien entre la variance et la valeur de la variable dépendante (les ventes) ;

De plus, les variables indépendantes ne doivent pas être colinéaire : une combinaison linéaire des autres variables ne doit pas permettre de reconstituer une variable.

  • La colinéarité est mesurée par deux indicateurs interdépendants : la tolérance (TOL) et le facteur d’inflation de la variance (VIF). Un seuil de 0.5 est souvent retenu pour la tolérance (VIF = 1/TOL = 2).
  • Lorsque la colinéarité des variables est trop importante, une régression ridge est effectuée. Les résultats sont biaisés par rapport à la régression linéaire classique mais la variance des paramètres estimés est plus faible et correspond donc à une meilleure précision.

2. La modélisation de la part de marché : q = m. Q

Cette modélisation est un peu plus complexe dans la mesure où deux modèles sont nécessaires : (1) un modèle du marché global (Q) et (2) un modèle de part de marché (m).

  • 1. Modèle du marché global
    • il correspond à la démarche précédente. Les variables peuvent être soit les variables de chaque marque ou des variables synthétiques (prix moyen par exemple).
    • lorsqu’une marque a une part de marché très importante, la modélisation des ventes globales est fortement influencée par son mix.
  • 2. Modèles simple de part de marché
    • La variable à expliquer est la part de marché (PdM, SOM share of Market) :
      • mi = qi / Q
    • La relation est linéaire ou multiplicative et les variables indépendantes sont aussi calculées de manière relative ( pi* = pi / Prix moyen)
      • mi = a + b. pi *
      • mi = a. Pi**b    (« ** » signifie mettre à la puissance)
    • Le prix à payer pour la simplicité de ce modèle est le manque de robustesse : une part de marché prévue pourra être supérieure à 100% du marché ou inférieure à 0% ! Ce qui rend le modèle peut crédible aux yeux de son utilisateur éventuel.
  • 2. Modèles de part de marché
    • la formulation générale est du type : Moi / (Moi+Eux) avec « Moi »  correspondant à l’attraction générale de la marque. Deux formulations sont possibles :
    • Modèle d’attraction : l’attraction est le produit des variables (ici P) élevé à la puissance de leur élasticité. Pour les variables binaires la transformation est exponentielle).
      • Par exemple pour la marque i en fonction de son prix (P) l’attraction s’écrit Ai = a0. Pi** b  avec (a, b) des paramètres à estimer.
    • Modèle exponentiel (logistique) : l’attraction de la marque est l’exponentielle de la somme des effets des variables du mix.
      • Ai = exp( a0 + b.Pi)
  • Estimation
    • L’estimation de ces modèles de part de marché est faite simultanément pour toutes les marques
    • Elle est rendue complexe par le fait que la somme des parts de marché est contrainte à 1.
    • Une solution a été trouvée en prenant une marque comme référence (mi/mj) et en mettant pour référence pour cette dernière la moyenne géométrique des parts de marché des autres marques (transformation de Nakanishi-Cooper).

Programmes SAS

  • Un petit jeu de données d’essai est fourni dans les bases de données proposées sur le site :
  • Les programmes en excel
  • Les programmes en SAS
    • market share models : Modèle linéaire des quantités
    • Mix_2 : modèle de part de marché linéaire
    • Mix_3 : Modèle d’attraction
    • Mix_4 : Modèle exponentiel
Publié dans Marketing SAS, Modèles Marketing