Rapport sur le biais OTA de GPT-5 — Analyse comparative (Nov 2025)
Les données 2025 de Hotelrank montrent que les versions mini et nano de GPT-5 amplifient systématiquement la visibilité des OTA, contrairement au comportement de base du modèle GPT-5.

Analyses refaites dans le temps, les résultats restent consistants.
Direct Links vs OTAs per GPT-5 model (%), November 2025 Update
Méthodologie
Cette étude repose sur l’analyse propriétaire de Hotelank.ai, basée sur plus de 10 000 requêtes formulées pour refléter des scénarios réels de recherche d’hôtels.
Afin de couvrir une variété de comportements utilisateurs, nous avons défini un panel cohérent de personas types :
- Couples
- Voyageurs âgés
- Familles avec enfants
- Voyageurs d’affaires en groupe
- Groupes de loisirs
- Voyageurs haut de gamme
- Voyageurs d’affaires en solo
- Voyageurs solo en loisir
Chaque persona a été utilisé pour interroger les IA sur des destinations et contextes variés (week-end romantique, séjour famille avec piscine, hôtel boutique près d’un centre de congrès, etc.). Nous avons considéré les hôtels 3, 4 et 5 étoiles (même si le standing n'est pas homogène partout).
Voici la liste des villes :
- New York
- Los Angeles
- Miami
- Paris
- Londres
- Rome
- Barcelone
- Amsterdam
- Berlin
- Dubai
- Bangkok
- Tokyo
- Shanghai
- Hong Kong
- Singapour
- Sydney
- Melbourne
- Le Cap
- Le Caire
- Istanbul
- Athènes
- Mexico City
- Rio de Janeiro
- Buenos Aires
- Toronto
Protocole de comparaison des modèles
Nous avons soumis les mêmes prompts à un ensemble sélectionné de trois variantes de modèles GPT-5, incluant :
- GPT-5
- GPT-5 nano
- GPT-5 mini
Ces modèles correspondent aux versions déployées dans l'interface de ChatGPT (GPT-5 = Thinking, GPT-5 mini = Thinking Mini) et GPT-5 nano est la version la plus rapide et efficiente de GPT-5 (par API).

Pour chaque réponse générée par l’IA, nous avons extrait et classé :
- L’ensemble des liens hôteliers, répartis en :
- OTA (Online Travel Agencies) — ex. : Booking.com, Expedia, Hotels.com
- Sites web d’hôtels en direct
- Modèle (nom)
- Contexte du prompt (persona, ville)
Voici nos résultats.
Plus le modèle "réfléchit", plus il donne de liens directs
Dans une précédente recherche sur les hallucinations de liens, je rappelais l'article d'OpenAI du 5 septembre qui expliquait que GPT-5 hallucinait beaucoup moins (mais donnait quand même de faux domaines).
De manière similaire, GPT-5 donne presque exclusivement des liens directs (>95%).
À l'inverse, les modèles mini ou nano donnent quasiment 30% d'OTAs.
Share of OTA Links by GPT Model (%)
Mais alors, quel impact côté utilisateur ? Il n'existe pas de données sur le taux d'utilisation des différents modèles, mais voici ce qu'on peut supposer.
- GPT-5 Nano
Aucun impact direct côté utilisateur… mais probablement un impact indirect. En effet, Nano était le modèle et plus rapide et surtout le moins cher, il est souvent utilisé comme brique de base pour les agents travel.
Mais il est assez sommaire, ce qui fait qu'il ne sera pas très bon pour des requêtes sophistiquées… comme peuvent l'être une recherche d'hôtel. - GPT-5 Mini
C'est sûrement le modèle par défaut dans l'interface pour une recherche de voyage. Il est utilisé pour des requêtes assez simples. Dans ce cas, il n'est donc pas étonnant de souvent voir des OTAs, vu que le modèle va à l'essentiel, et recommande donc jusqu'à 30% des OTAs. - GPT-5 (le grand, le vrai)
C'est le modèle utilisé pour des recherches poussées de voyage., pour croiser des informations, avec une recherche web, etc. Et dans ce cas, c'est une belle opportunité de revenue management pour les hôtels : presque que du direct !
Plus le nombre d'étoiles est haut, moins il y a d'OTAs
De manière intéressante, on retrouve un biais important dans les réponses des modèles selon les standings de l'hôtel :
- Recours massif aux OTAs (près de 50%) pour les 3* dans mini et nano
- En comparaison, GPT-5 n'en propose que 12%.
- Le phénomène persiste, dans une moindre mesure (autour de 30%), pour les 4*
- Et disparaît quasiment pour les 5*
- À noter que certains 5* ne sont pas sur les OTAs (ou moins d'OTAs).
En France, en 2024, sur les hôtels classés, les 3* représentaient 48,6% et les 4* 19,33% (source : Insee).
Cela pose donc un enjeu pour une majorité d'hôtels (et cela est a priori vrai aussi pour les 2*).
Share of OTA Links by GPT Model and star rating (%)
La typologie (et donc le budget) influence aussi le taux d'OTAs
D'une manière similaire, les hôtels les plus économiques — hostels, budget hotels, aparthotels et eco-lodges — affichent les taux les plus élevés de liens OTA, dépassant souvent 50 % dans les modèles mini et nano.
À l’inverse, les hôtels de luxe, les resorts ou les boutique hotels sont nettement moins cités via des OTA.
Share of OTA links by hotel type and model (%)
Cela souligne aussi un enjeu "d'équité algorithmique" : les établissements les moins chers — généralement les plus dépendants de la désintermédiation — sont ceux les plus enfermés dans le monopole des OTAs.
Le fun pour Booking, le sérieux pour le direct
Le loisir affiche les plus hauts taux d'OTA, alors que les voyageurs d'affaires et les personnes âgées reçoivent beaucoup moins de liens OTAs.
Il semble donc aussi y avoir un biais sur les segments de clientèle, ce qui peut poser un enjeu stratégique selon les hôtels.
Share of OTA links by persona and models (%)
Booking, le king
Même si Booking.com est probablement l'OTA le plus connu, le constat est écrasant : 85% des liens OTAs sont des liens Booking.
Cela augure-t-il d'un accord entre OpenAI et Booking ? On le saura probablement assez vite, encore plus depuis la sortie d'Instant Checkout, avec bientôt l'intégration de Shopify.
Top OTA domains
Conclusions
- Plus le modèle réfléchit, moins il donne de liens OTAs
- Plus le standing de l'hôtel est élevé, moins il donne d'OTAs
- Plus le budget est élevé, moins il donne d'OTAs
Aller plus loin
Comment expliquer ces biais ?
Voici quelques hypothèses :
- des jeux de données plus généralistes ou commerciaux (avec forte présence des OTA)
- un manque de “raisonnement” ou de contexte riche dans les modèles allégés
- une sur-optimisation pour des réponses rapides et standardisées.
- une présence digitale (et d'image de marque) moins forte sur les standings plus bas
