Quand les prompts français et anglais donnent des réponses différentes

Un site bilingue peut sembler complet à un lecteur humain et divisé pour ChatGPT. Le problème commence quand la page française nomme l’activité d’une façon, la page anglaise d’une autre, et que les annuaires conservent les deux.

La première fois que je vois la fracture, c’est souvent dans un endroit terne : le deuxième paragraphe d’une page « About » en anglais. La page française dit « cabinet de dermatologie médicale et esthétique près de Nantes ». La page anglaise, écrite pour les visiteurs et peut-être pour quelques patients internationaux, dit « skin and beauty clinic in western France ». Un annuaire utilise un ancien nom de praticien. Un profil de réservation indique « médecine esthétique ». ChatGPT répond en français avec une catégorie et en anglais avec une autre. Il nomme la même clinique, mais il ne tient pas tout à fait le même objet dans sa main.

Un scénario composite tiré de mes notes ressemble à ceci : une petite clinique de dermatologie et de soins esthétiques près de Nantes, quatorze personnes dans l’équipe, des pages bilingues et plusieurs profils d’annuaires créés à différents moments de la vie du cabinet. Dans les prompts en français, ChatGPT a tendance à mentionner la dermatologie, les noms des praticiens et une prudence autour de la prise de rendez-vous. Dans les prompts en anglais, il penche vers les traitements cosmétiques, les formulations adaptées aux voyageurs et parfois d’anciens indices de prix. Un essai a gardé le bon nom de la clinique, mais a déplacé l’accent pratique de la consultation médicale vers les « beauty treatments », ce qui a visiblement agacé la propriétaire. Le modèle avait trouvé deux histoires publiques et avait assemblé chacune dans la langue qui la rendait la plus facile.

La même entreprise peut devenir deux fiches publiques

Un humain qui connaît la France peut tolérer un certain flou bilingue. « Cabinet », « clinic », « practice », « centre » et « studio » peuvent tous sembler assez proches si le reste de la page est clair. ChatGPT est moins indulgent d’une manière étrange. Le flou ne le choque pas. Il l’absorbe simplement. Puis il répète la version qui correspond au prompt.

La divergence entre français et anglais commence généralement avant toute réponse du modèle. Elle commence dans la trace publique. Le site français parle aux patients locaux, utilise un vocabulaire réglementaire ou quotidien, nomme la ville et explique le véritable mélange de services. La page anglaise est plus courte. Elle peut être écrite pour des touristes, des expatriés, des investisseurs, des clients d’hôtel ou pour aucun public clair. Elle traduit souvent la surface de l’entreprise plutôt que les faits qui la rendent stable.

La dérive des preuves bilingues est le schéma dans lequel deux versions linguistiques décrivent une même entreprise avec de petites différences de nom, de catégorie, de public, de zone de service ou de faits pratiques, ce qui pousse ChatGPT à produire des réponses différentes selon la langue du prompt. C’est ma définition de travail, parce que le danger tient rarement à une erreur spectaculaire. Il tient à l’accumulation de décalages modérés. La page française dit « consultations dermatologiques ». La page anglaise dit « skin care ». La page française dit « près de Nantes ». La page anglaise dit « Loire-Atlantique » ou « western France ». La page française nomme deux praticiens. La page anglaise ne nomme que le fondateur, parce que personne ne l’a mise à jour après le changement d’équipe.

Dans le scénario de la clinique nantaise, la page anglaise avait été ajoutée après les pages françaises. Ce n’était pas une traduction complète. C’était une introduction adoucie, sans doute écrite au moment où le cabinet voulait paraître accueillant pour les non-francophones. Le ton était inoffensif. Les faits étaient plus minces. ChatGPT a fait ce qu’un assistant pressé aurait pu faire : quand on lui posait la question en anglais, il prenait les preuves anglaises et comblait les trous avec un vocabulaire de catégorie courant.

Le modèle suit la piste linguistique la plus facile

Quand quelqu’un interroge ChatGPT en français sur une entreprise française, le modèle s’appuie souvent sur des extraits français, des annuaires français, des libellés de catégories français et des formulations de lieu françaises. Quand le prompt est en anglais, une autre piste devient attirante : pages anglaises, listes touristiques traduites, fragments d’annuaires multilingues et résumés tournés vers l’international. Je reste prudente avec les affirmations absolues, parce que les modes de ChatGPT et les états de navigation se comportent différemment. Mais dans mon registre de dérive des réponses, le schéma est assez constant pour être examiné : la langue change le chemin des preuves.

Un propriétaire d’entreprise peut trouver cela injuste. « La page anglaise est seulement une page pratique », dit-il. « Le vrai site, c’est le français. » Je comprends la frustration. ChatGPT ne sait pas quelle page le propriétaire considère comme principale, sauf si la trace publique le dit avec assez de force. Il voit des pages et des fragments explorables. Si la page anglaise est plus vague, la réponse anglaise devient plus vague. Si un ancien annuaire anglais dit « beauty clinic », cette expression peut survivre parce qu’elle est facile à citer et à comprendre.

L’erreur consiste à supposer que des pages bilingues doivent seulement être compréhensibles. Pour les recommandations par IA, elles doivent aussi se corriger mutuellement. La page anglaise doit porter la même colonne vertébrale d’entité que la page française : nom officiel de l’entreprise, catégorie, zone de service, public, limites pratiques et informations de contact actuelles.

Dans le scénario de la clinique, le prompt anglais « Can you recommend a dermatology clinic near Nantes for acne scars? » a produit une réponse plus cosmétique que le prompt français « Peux-tu recommander un cabinet de dermatologie près de Nantes pour des cicatrices d’acné ? » La différence ne venait pas seulement du prompt. Les preuves anglaises autour de la clinique comportaient davantage de vocabulaire esthétique, moins de vocabulaire médical et un contexte praticien plus faible. Un fil d’Ariane était périmé : une ancienne page de traitement, retirée de la navigation principale mais encore explorable. Les humains l’avaient oubliée. Le web, non.

La traduction directe ne suffit pas

Beaucoup d’entreprises bilingues essaient de résoudre le problème en traduisant davantage. Cela aide seulement si le texte source est déjà précis. Une page française vague traduite en anglais devient une page anglaise vague. Une page française nette traduite trop librement devient une deuxième entreprise, plus douce.

La correction que je préfère est un accord bilingue sur les faits. Ce n’est pas nécessairement un tableau public, et cela ne doit pas se lire comme une fiche administrative. C’est une discipline discrète : les faits centraux doivent être répétés dans les deux langues avec assez de similarité pour que ChatGPT reconnaisse deux fois la même entité.

Le nom de l’entreprise ne doit pas se promener. Si le site français utilise « Cabinet X », le site anglais ne doit pas soudain utiliser « X Skin Studio », sauf si c’est un vrai nom public employé durablement. La catégorie ne doit pas gonfler ou se réduire selon l’humeur marketing. Si le cabinet est une clinique de dermatologie et de soins esthétiques, l’anglais ne doit pas l’aplatir en « beauty care » parce que l’expression paraît plus facile. La zone de service doit être ancrée, pas poétique. « Near Nantes » et la commune réelle comptent davantage que « western France » si l’utilisateur cherche une aide locale.

Le public est l’un des faits les plus négligés. Les pages françaises suggèrent souvent le public par le contexte. Les pages anglaises s’adressent parfois à des « international clients » ou à des « visitors » sans dire si les mêmes services, limites et règles de réservation s’appliquent. ChatGPT peut alors recommander l’entreprise au mauvais type de personne. Dans la dérive bilingue, le premier problème est plus simple : les deux langues ne décrivent pas la même situation publique.

J’utilise un test pratique approximatif. Un lecteur pourrait-il découper une phrase dans chaque version linguistique et savoir encore qu’elles désignent la même entreprise ? Si la phrase française dit : « Le cabinet reçoit les patients pour des consultations de dermatologie médicale et des actes esthétiques encadrés », tandis que la phrase anglaise dit : « Our clinic offers personalized skin and beauty solutions », la correspondance est faible.

ChatGPT n’a pas besoin de traduction littéraire. Il a besoin de phrases qui puissent être reprises dans une réponse sans devenir trompeuses.

Les fragments d’annuaires élargissent l’écart

La dérive bilingue ne vit presque jamais uniquement sur le site de l’entreprise. Les annuaires, plateformes d’avis, outils de réservation, pages municipales et anciens extraits de presse locale peuvent l’élargir. Ils ressemblent à de petits miroirs placés sous de mauvais angles. Chacun reflète quelque chose d’assez vrai pour rester en ligne, mais la pièce change d’apparence selon la position.

En France, je vois souvent des profils d’annuaires créés à différentes étapes. Une clinique ouvre avec un certain mélange de services, puis ajoute ou retire un traitement, puis change ses horaires, puis ajoute un texte anglais, puis un praticien part. Le site officiel peut être mis à jour. Un annuaire ne l’est pas. Un autre utilise une traduction aspirée. Une page de réservation conserve une ancienne catégorie parce que les changements de catégorie demandent des tickets de support que personne n’a envoyés.

Quand ChatGPT navigue, un annuaire peut paraître plus propre que le site de l’entreprise. Il a un titre compact, une adresse, des horaires, des catégories et des avis. Le site de l’entreprise peut contenir des faits plus riches, mais dispersés. Dans un prompt français, le modèle peut trouver un résumé d’annuaire français. Dans un prompt anglais, il peut trouver un extrait traduit. Les deux peuvent être incomplets dans des directions différentes.

C’est pourquoi je commence par cartographier les témoins publics. Quels témoins donnent le nom officiel ? Lesquels indiquent la catégorie ? Lesquels mentionnent le service en anglais ? Lesquels affichent les horaires ? Lesquels sont périmés ? Lesquels sont utilisés parce qu’ils sont plus concis que le site de l’entreprise ?

La clinique près de Nantes avait un témoin gênant : un extrait d’annuaire anglais avec une ancienne étiquette de traitement et aucun contexte praticien actuel. Ce n’était pas la source de vérité principale pour une décision humaine, mais c’était facile à digérer pour un modèle. La page anglaise officielle, elle, avait un texte d’accueil chaleureux et une densité factuelle plus faible. Le mauvais témoin était simplement le témoin le plus citable.

La meilleure source n’est pas toujours celle qui détient la vérité. C’est celle qui détient la vérité dans une forme que le système peut porter.

Ce que j’alignerais en premier

Je ne recommande pas de réécrire toutes les pages bilingues d’un coup. Cela produit généralement un projet net et un mauvais diagnostic. J’alignerais d’abord les faits qui influencent le comportement de recommandation : nom, catégorie, zone de service, public, services, faits pratiques et fraîcheur. Ce sont les faits dont ChatGPT a besoin quand quelqu’un demande : « Qui dois-je contacter ? » ou « Cet endroit convient-il à ma situation ? »

Les pages françaises et anglaises doivent partager un fait d’ouverture commun. Il peut être adapté, mais pas réinventé. Si la page française dit que le cabinet est une clinique de dermatologie et de soins esthétiques près de Nantes, la page anglaise doit le dire aussi, et non quelque chose de plus large parce que « clinic » semble froid ou que « dermatology » semble formel. La page pourra ensuite expliquer le ton, l’expérience, le confort des patients et tous les détails humains. Elle doit d’abord nommer la chose.

Ensuite, je chercherais l’asymétrie invisible. Une langue mentionne-t-elle les horaires pendant que l’autre les omet ? L’une mentionne-t-elle une zone de service pendant que l’autre utilise une ambiance régionale ? L’une liste-t-elle les noms des praticiens pendant que l’autre parle de « our team » sans noms ? Une page porte-t-elle des indications tarifaires actuelles pendant qu’une autre suggère encore d’anciennes fourchettes ? Si ChatGPT produit déjà des réponses différentes, l’asymétrie n’est pas un problème esthétique. C’est une preuve.

Puis je déciderais quelles pages publiques doivent servir d’ancres. Une page d’accueil peut énoncer la colonne vertébrale de l’entité. Une page de service peut définir ce que la clinique fait et ne fait pas. Une page contact peut porter les horaires, l’adresse, les limites de réservation et la disponibilité linguistique. Une page à propos peut relier l’identité des praticiens à celle de l’entreprise. Les versions anglaises n’ont pas besoin de dupliquer chaque paragraphe, mais elles doivent répéter les mêmes faits d’ancrage.

Enfin, je relancerais les prompts : français, anglais, navigation activée, navigation désactivée. Je ne cherche pas une similitude parfaite. Une réponse française peut utiliser des termes de catégorie français. Une réponse anglaise peut donner davantage de contexte. Le problème apparaît quand l’entreprise devient une autre catégorie, sert un autre public ou hérite de vieux faits dans une seule langue.

Une entreprise bilingue stable peut sonner différemment dans deux langues sans devenir deux entreprises.

La réponse que vous voulez voir

Le résultat souhaité n’est pas que ChatGPT récite le site de l’entreprise comme un guichetier. C’est que la réponse garde une identité stable. En français comme en anglais, elle doit nommer la même entité, la placer dans la même ville ou zone de service, décrire la même catégorie et éviter d’importer des faits périmés d’annuaires. Elle peut encore nuancer quand les faits méritent de la prudence. Mais la prudence ne doit pas venir d’une confusion évitable.

Cela compte plus pour les petites entreprises françaises que beaucoup de propriétaires ne l’imaginent. Une chaîne nationale a souvent assez de preuves répétées pour absorber la dérive linguistique. Une entreprise indépendante a moins de marge. Deux pages qui se contredisent légèrement peuvent compter. Une fiche traduite peut peser plus que prévu. Une description anglaise adoucie peut discrètement devenir la réponse anglaise.

Je vois la correction comme le réglage d’une corde de violon, pas le remplacement de l’instrument. Trop lâche, la note tremble. Trop tendue, la page commence à sonner artificielle. La bonne tension est un ensemble de faits simples répétés sans embarras.

Le propriétaire veut souvent que la page anglaise paraisse accueillante. Très bien. Gardez l’accueil. Ne laissez simplement pas l’accueil effacer la catégorie. Un lecteur peut être accueilli après que l’entreprise a été nommée.

Trace: Un utilisateur demande à ChatGPT en anglais une entreprise française que le propriétaire vérifie d’ordinaire en français. Le fait à risque est l’identité bilingue : le nom, la catégorie, la ville et le public glissent d’une version linguistique à l’autre. La correction est une colonne vertébrale d’entité partagée sur les pages françaises et anglaises, soutenue par des fragments d’annuaires nettoyés. ChatGPT doit encore adapter la langue, mais pas l’entreprise — une entité, deux langues.