Carte des loyers par commune – Entretien avec Marie Breuillé et Camille Grivault.
La Carte des loyers
PolitiqueduLogement (PL). Que trouve-t-on quand on se connecte sur le site du ministère de la transition écologique « Carte des loyers » ?
Marie Breuillé (MB). On trouve sur la page du ministère deux cartes interactives donnant pour chaque commune un indicateur, c’est-à-dire un loyer estimé, charges comprises, par mètre carré pour un bien type, l’un pour les appartements et l’autre pour les maisons. Ces indicateurs peuvent intéresser, par exemple, un particulier qui cherche à louer un logement ou un élu local qui veut mettre en place une politique de l’habitat. Chacun peut consulter gratuitement les indicateurs, qui ont été estimés pour 2018 pour chaque commune (figure 1 et 2, gauche). En se déplaçant sur la carte, l’utilisateur obtient le loyer d’un logement type pour un appartement ou une maison à Dijon (figures 1 et 2).
Figure 1. Trouver le loyer d’un appartement dans votre commune
Loyer d’annonce par m² charges comprises pour un appartement type du parc privé locatif (€) en 2018
Figure 2. Trouver le loyer d’une maison dans votre commune
Loyer d’annonce par m² charges comprises pour une maison type du parc privé locatif (€) 2018
En complément de ces cartes interactives sur le site du ministère en charge dulogement, l’utilisateur peut télécharger, sur le site data.gouv.fr, des tableaux qui, pour chaque commune, proposent des informations supplémentaires permettant d’apprécier la qualité et la précision des estimations : le coefficient de détermination (R²), les intervalles de prédiction et le nombre d’observations utilisées pour chaque maille et chaque commune.
La méthodologie permettant d’obtenir ces résultats est téléchargeable sur data.gouv.fr (« Carte des loyers » – Indicateurs de loyers d’annonce par commune en 2018 – data.gouv.fr).
(Extraits de www.data.gouv.fr[1])[/typography]
« Ce partenariat innovant a permis de reconstituer une base de données avec plus de 9 millions d’annonces locatives. A partir de ces données, l’équipe de recherche a développé une méthodologie d’estimation d’indicateurs, à l’échelle communale, du loyer (charges comprises) par m² pour les appartements et maisons[2].
« Ces indicateurs expérimentaux sont mis en ligne afin d’être utilisable par tous : services de l’Etat, collectivités territoriales, professionnels de l’immobilier, particuliers bailleurs et locataires. Dans une deuxième phase du projet, la méthodologie devra être consolidée et pérennisée, pour prévoir une actualisation à intervalle régulier de ces indicateurs.
« Ce projet fournit une information complémentaire à celle offerte par les Observatoires Locaux des Loyers (OLL), déployés depuis 2013 et renforcés depuis 2018 par la loi Elan. Aujourd’hui, ce réseau associatif de 30 OLL publie chaque année des informations précises sur les loyers pratiqués dans 51 des principales agglomérations françaises ».[/typography]
L’origine des données
PL. D’où viennent les données ?
MB. Il s’agit de données d’annonce provenant d’un partenariat inédit avec trois plateformes : Seloger, leboncoin et PAP. Ce sont des loyers de marché, charges comprises, pour des logements proposés à la location.
PL. Pourquoi la Direction de l’habitat, de l’urbanisme et des paysages (DHUP)[3] vous a-t-elle demandé cette étude ?
MB. Nous travaillons avec le ministère en charge du logement depuis 2015. Initialement, notre équipe a été retenue pour réaliser une étude visant à comprendre les déterminants des loyers dans le parc locatif privé en exploitant, pour la première fois, les données des observatoires locaux des loyers (OLL). L’étude actuelle produisant la carte des loyers a suivi. L’objectif était de déterminer un loyer pour chaque commune française en partenariat avec les organismes acceptant d’apporter leur concours.
PL. Est-ce le ministère qui a négocié les données avec Seloger, leboncoin et Particulier à Particulier ? Il y a d’autres organismes qui fournissent des données d’annonces de loyers. Pourquoi un partenariat avec ces trois plateformes ?
MB. Nous avons contacté, avec le Bureau des études économiques de la DHUP, différents organismes immobiliers mais, à l’étape actuelle de l’étude, seuls les trois retenus ont accepté de fournir des données. C’est la première fois qu’ils acceptent de participer à une telle opération.
Un des avantages de ce partenariat est que nous avons l’intégralité des annonces qui ont été publiées sur les trois plateformes pour la période 2015-2019. Cela évite un biais, connu dans la littérature, sous le nom de Time on market (TOM)[4]. Neuf millions d’annonces, après dédoublonnage, sont renseignées dans notre base pour la France entière (à l’exception de Mayotte), concernant 7,5 millions d’appartements et 1,5 millions de maisons.
Les apports de la carte des loyers dans le paysage des statistiques sur les valeurs locatives
PL. On peut supposer que dans les communes couvertes par un Observatoire local des loyers, ce sont les résultats de celui-ci qui sont examinés plutôt que vos estimations.
Camille Grivault (CG). Par rapport aux observatoires locaux des loyers (OLL), nous apportons des informations pour des territoires qui ne sont pas couverts par un OLL et où peu de données existent. Là où il y a un OLL, ce sont ses valeurs qui font référence.
MB. En effet, les observatoires locaux des loyers produisent des informations différentes des nôtres. Les OLL donnent des loyers hors charges des logements occupés (et non des logements à louer) par type de logement et à des niveaux infra-communaux dans les grandes villes. L’objectif du ministère en charge du logement est, là où les OLL ne sont pas présents, de fournir des données là où n’y en avait pas, ou pas suffisamment.
PL. L’apport pour le monde rural est important pour les maisons car il y en a beaucoup sur le marché locatif (jusqu’à un quart du parc). Vous apportez une information qui n’existait pas.
MB. On obtient, en effet, des informations qui sont rares ou qui manquent dans les petites villes et les communes rurales.
PL. Cela peut être utile, par exemple pour établir un PLH. Même s’il y a un OLL, il ne couvre généralement pas tout le territoire de l’intercommunalité. L’information peut donc être utile pour définir la politique locale du logement. Il y a aussi un autre domaine où cela peut être utile, qui est celui des valeurs locatives fiscales, dont les bases actuelles remontent à 1970, alors que la hiérarchie des valeurs a beaucoup changé depuis.
Quelle est la place de vos résultats par rapport à ceux publiés par d’autres organismes privés ?
MB. Aucun organisme privé ne donne actuellement accès gratuitement à des indicateurs de loyers calculés pour chaque commune de France, a fortiori sur la base d’une méthodologie totalement transparente. Tous les choix méthodologiques sont en effet détaillés et des statistiques très précises sont fournies, comme par exemple le nombre de données d’annonces utilisées par commune. De plus, la taille de la base de données est considérable, avec 9 millions d’annonces, grâce au partenariat avec les 3 plateformes leboncoin, SeLoger et PAP.
PL. Qu’en est-il par rapport à PriceHubble ?
MB. PriceHubble[5] nous a contactés après le premier communiqué de presse citant notre carte. Ils ont mis à notre disposition leurs données pour permettre de comparer les résultats. Nous avons trouvé une très bonne correspondance entre les deux. La comparaison a également été faite avec les résultats des OLL, et la corrélation est très forte.
PL. Y a-t-il des expériences du même type dans d’autres pays européens ?
MB. Nous n’en connaissons pas, malgré les recherches que nous avons faites.
La précision des données
PL. L’absence de découpage des grandes communes est gênant, car à l’intérieur d’une même ville la dispersion des loyers peut être importante. Par exemple à Toulouse les loyers sont très différents selon les quartiers. Pourra-t-on à l’avenir améliorer la précision de la géolocalisation ?
CG. On dispose de l’adresse précise dans certains cas, mais pas suffisamment nombreux pour appliquer la méthode à un niveau infra-communal.
MB. Toulouse est un bon exemple : c’est la commune où le nombre d’observations pour une maille (cf. encart) est maximum (210313 observations). Il sera possible de fournir ultérieurement des indicateurs plus fins dès lors qu’on aura l’adresse précise du logement.
PL.Vous n’avez pas les loyers hors charges alors que les charges sont un fourre-tout hétérogène (intégration ou non du chauffage, qui dépend du climat …).
MB. Dans les données dont nous disposons, nous n’avons pas eu la possibilité d’isoler le loyer hors charges[6]. C’est une limite des données, et donc des résultats, qui est mentionnée sur le site. Nous espérons que, par la suite, avec la reprise du projet par l’Agence nationale pour l’information sur le logement (ANIL), il sera possible de distinguer le loyer hors charges et les charges.
(Extraits de www.data.gouv.fr)[/typography]
Les indicateurs de loyers sont fournis charges comprises pour des biens types mis en location au 3ème trimestre 2018 avec les caractéristiques de référence suivantes :
– pour un appartement : surface de 49 m² et surface moyenne par pièce de 22,1 m²
– pour une maison : surface de 92 m² et surface moyenne par pièce de 22,5 m²
Conditions d’utilisation des données
Ces indicateurs sont utilisables librement, sous réserve de mentionner la source sous la forme suivante : « Estimations UMR 1041 CESAER (AgroSup Dijon-INRAE) à partir des données SeLoger, leboncoin, pap.fr ».
Précautions d’emploi
Les indicateurs de loyers sont calculés charges comprises, sur des données d’annonces, donc mesurent des loyers de flux uniquement. Les données ont été dédoublonnées mais sans pouvoir s’appuyer sur des photos et des caractéristiques très discriminantes. Pour les communes n’ayant aucun logement mis en location via une annonce sur au moins un des 3 sites sur la période considérée, l’indicateur de loyer est celui estimé pour une maille plus grande comprenant des communes voisines présentant des caractéristiques similaires.[/typography]
Eléments de méthodologie
PL. Comment avez-vous traité les données ?
MB. Dans certaines parties du territoire, en particulier les zones rurales, il n’y avait aucune annonce publiée sur au moins une des trois plateformes. Cela représente 31% des communes pour les appartements et 12% pour les maisons. L’estimation des indicateurs de loyers pour ces communes a été un défi majeur. Nous avons utilisé un algorithme de « clustérisation spatiale » qui découpe le territoire en mailles homogènes du point de vue du marché locatif privé. Cet algorithme constitue des mailles qui comportent au moins 500 annonces publiées. Pour cela, chaque commune est examinée et s’il y a moins de 500 annonces publiées, l’algorithme cherche parmi les communes contiguës celles qui sont les plus semblables en se basant sur 14 variables qui caractérisent le parc locatif privé et les locataires. L’estimation a ensuite été faite pour chacune des mailles par la méthode des prix hédonistes (cf. encart) pour produire une valeur estimée du loyer pour un appartement ou une maison de référence (cf. verbatim 2).
La méthode est du même type que celle de l’indice Notaires-Insee pour les valeurs vénales, quoique les mailles soient définies différemment. L’estimation d’un modèle pour chaque maille respecte la condition théorique de la méthode hédoniste d’un marché unifié en supposant qu’un ménage qui recherche un logement peut se déplacer à l’intérieur de la maille pour examiner chacune des offres et choisir celle qui lui est la plus adaptée. Ce ne serait pas le cas d’un modèle estimé pour l’ensemble national, comme cela est souvent fait. La méthode hédoniste suppose également que le marché ne soit pas segmenté.[/typography]
PL. On a donc des loyers estimés pour des ensembles de communes ?
MB. Dans chaque maille, qui compte donc 500 observations minimum, on procède à une estimation des prix hédoniques. Ensuite, nous prédisons le loyer pour un bien type. Pour toutes les communes dont la maille compte moins de 50 communes possédant au moins une annonce (dont les 40% des communes qui constituent une maille à elles-seules) et qui ont plus de 100 annonces de location sur leur territoire, la prédiction est réalisée au niveau de la commune. Pour les communes dont la maille compte plus de 50 communes possédant au moins une annonce (environ 4,2% des mailles pour les appartements et 8,5% pour les maisons) et qui ont plus de 100 annonces de location dans l’EPCI, la prédiction est réalisée au niveau de l’EPCI. Dans les autres cas, soit 64% des communes pour les appartements et 65% pour les maisons, la prédiction est fournie au niveau de la maille.
Des estimations séparées selon le nombre de pièces ont été faites mais elles ne sont pas diffusées.
PL. Se baser sur les prix d’annonce n’est pas un gros problème, car il y a rarement négociation sur le loyer : on loue au prix demandé ou on ne loue pas. Mais comment traitez-vous le fait qu’un bailleur peut réviser à la baisse son prix d’annonce s’il n’a pas de candidat ?
MB. Nous avons procédé à des dédoublonnages. Tout d’abord à l’intérieur de chacune des plateformes : lorsqu’une annonce est mise à jour, nous ne retenons que la dernière. Les doublons entre les trois bases de données ont également été supprimés.
Perspectives
PL. Quel positionnement par rapport au Conseil national de l’information statistique (CNIS) et aux services statistiques ministériels (SSM) ? Comment rendre votre étude plus visible par rapport à la statistique « officielle » (Insee, CNIS) ?
MB. Ce projet a été en effet initié par la DHUP, qui n’est pas un acteur faisant partie stricto sensu de la sphère « statistique ». Initialement, le projet était très expérimental : il s’agissait d’étudier la faisabilité de mobiliser des sources de données nouvelles pour produire
des indicateurs locaux. Ni l’Insee, ni les services statistiques ministériels, n’ont jamais utilisé des données d’annonces. Nous avons néanmoins échangé au cours du projet avec l’Insee, le service statistique du ministère du logement, ou encore le CGEDD, sur les choix méthodologiques qui ont été faits. Dans la suite, le projet a vocation à s’inscrire dans les dispositifs d’observations portés par l’ANIL, avec les observatoires locaux des loyers (OLL). Le projet a d’ailleurs fait l’objet d’une présentation devant le comité scientifique des OLL. Il sera intéressant de poursuivre les échanges méthodologiques avec les acteurs du service statistique publique, à la fois à titre d’information, mais aussi pour éclairer les futurs choix méthodologiques de retours d’experts.
PL. Vous prévoyez une mise à jour tous les deux ans. Cela ne pourrait-il pas être fait plus souvent ?
MB. Si c’est possible, tant mieux ! Les partenaires peuvent fournir des données à intervalles courts. En outre, la méthode de traitement n’est pas figée, des développements pourraient être envisagés si les partenaires peuvent apporter des données plus riches (loyer hors charges et provisions pour charges, localisation précise des logements, dédoublonnage en utilisant l’intelligence artificielle.
CG. Il doit également être possible de décliner des indicateurs par segments de marché. Mais l’infrastructure technique est assez lourde. C’est pourquoi je vais travailler à mi-temps avec l’ANIL sur le développement du prototype actuel
Propos recueillis par Jean Bosvieux et Jean Cavailhès
Janvier 2021
[1] Cf. https://www.data.gouv.fr/fr/datasets/carte-des-loyers-indicateurs-de-loyers-dannonce-par-commune-en-2018/ (Ce jeu de données provient d’un service public certifié).
[2] Marie Breuillé, Camille Grivault, Julie Le Gallo (2020). Note technique présentant de manière détaillée la méthodologie d’estimation des indicateurs de loyer (https://www.data.gouv.fr/fr/datasets/r/c8d391a7-ac78-445f-a6c6-9f6f04ed3e0e).
[3] La DHUP est une direction de la direction générale de l’aménagement, du logement et de la nature (DGALN) du ministère de la cohésion des territoires et des relations avec les collectivités territoriales.
[4] Note de la rédaction. les annonces qui disparaissent le plus vite d’un site sont celles qui présentent le meilleur rapport qualité / prix car elles sont louées peu de temps après avoir été mises en ligne. Ce sont les annonces de logements trop chers pour une qualité donnée qui restent longtemps sur le site, qui vont donc être sur-représentées quand on consulte ce site à un moment T. Il en résulte, en moyenne, un biais de sur-estimation des loyers publiés sur le site.
[5] PriceHubble est une startup qui vend à des professionnels de l’immobilier résidentiel des estimations de valeurs immobilières et des conseils. Elle collecte et structure des données sur les transactions, annonces, environnement urbain, permis de construire, transports, etc. qui sont analysées par des algorithmes d’intelligence artificielle pour proposer des estimations de prix ou de loyer de marché aux organismes qui ont passé un contrat avec PriceHubble.
[6] Note de la rédaction. Le loyer charges comprises est toujours indiqué dans les annonces des trois plateformes. Le loyer hors charges n’apparaît pas. Seules les annonces deSeloger, qui indiquent le montant de la provision pour charges, pourraient permettre de le calculer, mais cette donnée n’a pas été communiquée.