Anatomie d’une recherche d'hôtel dans ChatGPT — Comment les LLMs classent, citent et trient les hotels [Nov 2025]
Ce décryptage montre, étape par étape, comment une simple requête — « meilleurs hôtels à New York » — active un double système de recherche combinant de diverses sources (OTAs, direct, 3rd party) et données structurées de Google Maps. Chaque hôtel devient un objet (appelé "Entity"), avec Place ID (de Google !!), note et coordonnées.

![Anatomie d’une recherche d'hôtel dans ChatGPT — Comment les LLMs classent, citent et trient les hotels [Nov 2025]](https://cdn.sanity.io/images/g4atoftp/production/d7dc579aef8546dadc6d2670f614c512787f5308-3446x1808.png?rect=0,43,3446,1723&w=1200&h=600)
Introduction
Cet article présente une analyse technique complète d’une recherche web de GPT-5 en novembre 2025, avec pour prompt :
“best hotels in NYC”
(ou en français pour les puristes, « Meilleurs hôtels New York »)
Il révèle comment le système interprète le prompt, exécute les recherches web et réconcilie les "entités". Il fusionne les résultats provenant de sources différentes et de données structurées, puis restitue une réponse géolocalisée — similaire à une carte Google Maps.
ChatGPT a probablement sorti le 18 octobre une mise à jour que l’on pourrait qualifier de mise à jour “Entity”, visant à unifier les mentions :
Par exemple, « XX » est désormais reconnu comme la marque XX, « YY » comme l’hôtel YY. Vous pourrez en savoir plus ici.
Breaking news : nous démontrons ici que, pour les hôtels, ChatGPT utilise tout simplement… Google Maps.
Petit clin d’œil : chez Hotelrank, nous faisons la même chose depuis longtemps. Nous relions les hôtels mentionnés à leur entité Google Maps (et ce bien avant le 18 octobre !). Quel hôtel n'est pas sur Google Maps ?
Comment retrouver ces données ?
- Ouvrez votre navigateur (pas l’application) : https://chatgpt.com
- Ouvrez les outils de développement (cmd + shift + I sur Chrome / Mac).
- Effectuez la recherche : “best hotels in New York” (ou n’importe quelle recherche).
- Dans l’onglet Network → Fetch / XHR, ouvrez la conversation.
- Observez la réponse EventStream : toutes les lignes y sont.
La flemme ? Installez simplement cette extension Chrome et laissez-la faire le travail : ici
PHASE 1 — Initialisation et Contexte de Session (Lignes 1–5)
event: delta_encoding
data: “v1”
- Analyse technique
- Protocole : Server-Sent Events avec delta encoding (v1).
- Objectif : Permettre la mise à jour incrémentale et le streaming en temps réel.
- Importance : Confirme la présence du pipeline SSE harmonisé utilisé dans toutes les sessions de recherche GPT-5.
- Insight
- Toutes les sessions de recherche ChatGPT démarrent désormais avec delta_encoding:v1, marquant le début du flux en direct.
Création des Messages Système et Utilisateur (Lignes 6–13)
data: {“message”:{“author”:{“role”:“system”}}, “metadata”:{“is_visually_hidden_from_conversation”:true}}
data: {“message”:{“author”:{“role”:“user”},“content”:{“parts”:[“Can you recommend hotels in New York?”]}}}
- Analyse technique
- Le message système initialise le contexte (invisible pour l’utilisateur)
- Le message utilisateur transporte la requête en langage naturel (poids = 1.0).
- Les métadonnées incluent request_id, turn_exchange_id et horodatages.
- Insight
- GPT-5 journalise chaque interaction sous forme de flux d’événements pour le suivi de latence et la corrélation diagnostique.
PHASE 3 — Classification de l’Intention de Recherche (Lignes 14–18)
“search_prob”: 0.972,
“complex_search_prob”: 0.022,
“no_search_prob”: 0.005,
“classifier_config_name”: “sonic_classifier_3cls_ev3”
- Analyse technique
- Classifier :sonic_classifier_3cls_ev3
- Décision : déclenchement automatique d'une recherche web (97,2 % de probabilité).
- Interprétation : GPT-5 évalue plusieurs probabilités et ne lance une recherche web que si le score est suffisamment élevé.
- Les requêtes liées aux hôtels déclenchent souvent une recherche, probablement à cause du prix et de la disponibilité.
- Complexité : faible (2,2 %). En effet, ça ne semble pas trop dur à comprendre.
- Insight
- Le classifier “Sonic 3 classes” distingue : no-search, simple et complex search. Ici, la requête est reconnue comme une recherche géolocalisée — logique.
PHASE 4 — Exécution de la Recherche Web (Lignes 19–90)
“tool”: “web.run”,
“sonicberry_model_id”: “current_sonicberry_paid”,
“queries”: [“best hotels in New York”, “top hotels”]
- Analyse technique
- Outil : web.run → exécution d’une recherche web.
- Moteur : sonicberry_paid (c'est mon compte payant, mais cela influe juste sur la priorité du crawl et l'enrichissement d'entité.)
- Une requête initiale devient deux sous-requêtes :
- “best hotels in New York”
- “best hotels”
- Insight
PHASE 5 — Search Result Aggregation (Lines 91–200)
Here is an excerpt of the different domains.
“domain”: “www.cntraveler.com”, “title”: “The 47 Best Hotels in New York City”
“domain”: “www.tripadvisor.com”, “title”: “THE 10 BEST Hotels in New York City 2025”
“domain”: “www.theplazany.com”, “title”: “The Plaza Hotel: Luxury Hotel Near Central Park”
“domain”: “www.reddit.com”, “title”: “Looking for the best hotel : r/FATTravel”
.....
- Analyse Technique
- Regroupement par domaine pour déduplication.
- Inclut sources éditoriales, UGC (User-Generated Content) et OTA (Online Travel Agencies) ainsi que les sites en direct
- Certaines entrées comportent une date...
- C'est important, car il a été prouvé que les LLMs favorisaient la récence (même artificielle) .... Voici le papier de recherche (ici)
- Insight
- GPT-5 combine autorité éditoriale (Condé Nast, ...), listings d'OTAs (TripAdvisor) and User-Generated Content (coucou Reddit).
PHASE 6 — Préparation de la Réponse (Lignes 201–230)
“message”:{“id”:“0ba68976…”,“status”:“in_progress”,“content”:{“parts”:[””]}}
“marker”: “user_visible_token”
- Analyse technique
- Création du conteneur de message assistant.
- user_visible_token marque le début du flux de texte visible (ce qu'on voit dans l'interface)
- La modération d’URL est exécutée en parallèle avant chaque bloc.
- Insight
- Une vérification de sécurité est effectuée inline, garantissant que seules les URL conformes sont affichées.
Mais je suppose que ça n'intéresse pas grand monde.
PHASE 7 — Génération de Contenu “Entity-Aware” (Lignes 231–700)
GPT-5 fusionnent toutes les sources ... et ressort Google Maps
Exemple 1 — The Plaza, New York
“entity_data”: {
“id”: “ChIJYaVdffBYwokRnTOoCzCq9mE”,
“address”: “768 5th Ave, New York NY 10019”,
“rating”: 4.5,
“review_count”: 6767,
“price_str”: “$1,687”
}
Exemple 2 — Four Seasons Hotel New York Downtown
RAW DATA
“entity_data”: {
“id”: “ChIJiz9V4xhawokRorqq7eXaNxM”,
“address”: “27 Barclay St, New York NY 10007”,
“rating”: 4.7,
“review_count”: 1275,
“price_str”: “$1,892”
}
Exemple 3 — The Langham, New York, Fifth Avenue
RAW DATA
“entity_data”: {
“id”: “ChIJMYIE-KlZwokRt7ks1WKMXNU”,
“address”: “400 5th Ave, New York NY 10018”,
“rating”: 4.6,
“review_count”: 1695,
“price_str”: “$1,050”
}
- Analyse Technique
- Entité : local_business (hôtel)
- Métadonnées : adresse, ID Google Place, avis, prix.
- Le rang est probablement influencé par les avis (et le prix)
- Données visuelles issues des éditeurs et des marques.
- Insight
- GPT-5 produit désormais des cartes d’hôtel ancrées sur des entités réelles, similaires au Knowledge Graph.
Et cet ID… correspond bien à un Google Place ID !
- GPT-5 produit désormais des cartes d’hôtel ancrées sur des entités réelles, similaires au Knowledge Graph.
PHASE 8 — Synthèse Carte et Multi-Entités
“entities”: [
{“name”:“The Plaza”,“latitude”:40.7646,“longitude”:-73.9743},
{“name”:“Four Seasons Hotel New York Downtown”,“latitude”:40.7126,“longitude”:-74.0091},
{“name”:“The Langham, New York, Fifth Avenue”,“latitude”:40.7501,“longitude”:-73.9837}
]
- Analyse Technique
- Fusion des entités dans une couche géospatiale unifiée
- Coordonnées issues des identifiants Google Maps.
- Génération dynamique de liens cartographiques.
- Insight
- GPT-5 intègre dorénavant une intelligence géospatiale, combinant directement les données de localisation et les réponses textuelles.
PHASE 9 — Finalisation de la Réponse
“status”: “finished_successfully”
“message_stream_complete”: true
- Analyse Technique
- Fermeture du flux.
- Consolidation des métadonnées de citation et d’attribution.
- Vérification finale de conformité.
- Insight
Chaque mention d’hôtel se conclut par une attribution vérifiable et des métadonnées propres.
Alors, on retient quoi ?
1. L’entité prime à présent sur le mot-clé.
Votre présence en ligne devient cruciale. Avez-vous vérifié votre fiche Google Business Profile ?
2. Les métadonnées dynamiques (prix, avis) influencent le classement.
Plus vous avez d’avis, plus vous êtes mentionné. (Nous publierons prochainement des données à ce sujet.)
3. La “compression de citations” fusionne plusieurs mentions vérifiées.
Hotelrank aide à comprendre quelles sources, parfois invisibles dans ChatGPT, contribuent à cette consolidation.
4. ChatGPT devient une carte.
Et c’était déjà le thème de notre tout premier article.
