Créer un sitemap dynamique optimisé SEO et LLMs en 2026 — Next.js + IndexNow
Les sitemaps XML restent fondamentaux pour le SEO en 2026. IndexNow (Bing, Yandex, Naver) traite 5+ milliards d'URLs par jour. Ce guide couvre la génération dynamique en Next.js, IndexNow, les sitemaps images/vidéos/news, et la configuration robots.txt pour les crawlers IA (GPTBot, ClaudeBot, PerplexityBot).

Sitemaps XML en 2026 : les règles qui comptent
Règles stables : 50 000 URLs max par fichier. <changefreq> et <priority> sont ignorés par Google — seul <lastmod> est utilisé (si les dates sont fiables). N'inclure que les URLs canoniques, indexables, code 200.
Référencer dans robots.txt : Sitemap: https://example.com/sitemap.xml. Utiliser un sitemap index pour les sites 50k+ pages, segmenté par type de contenu.
Génération dynamique avec Next.js App Router
// app/sitemap.ts
import type { MetadataRoute } from 'next';
export default async function sitemap(): Promise<MetadataRoute.Sitemap> {
const posts = await fetch('https://api.example.com/posts').then(r => r.json());
return [
{ url: 'https://example.com', lastModified: new Date(), priority: 1 },
...posts.map(post => ({
url: `https://example.com/blog/${post.slug}`,
lastModified: new Date(post.updatedAt),
}))
];
}Pour les gros sites (50k+ pages), utilisez generateSitemaps() pour générer automatiquement /sitemap/0.xml, /sitemap/1.xml, etc.
IndexNow : indexation instantanée sur Bing
Supporté par Bing, Yandex, Naver, Seznam, Yep — pas Google. 22 % des URLs cliquées sur Bing proviennent d'IndexNow.
async function submitToIndexNow(urls, apiKey, host) {
await fetch('https://www.bing.com/indexnow', {
method: 'POST',
headers: { 'Content-Type': 'application/json; charset=utf-8' },
body: JSON.stringify({
host, key: apiKey,
keyLocation: `https://${host}/${apiKey}.txt`,
urlList: urls
})
});
}Robots.txt et crawlers IA en 2026
Les User-Agents IA à connaître : GPTBot, ChatGPT-User, ClaudeBot, PerplexityBot, Google-Extended. Stratégie : distinguer crawlers de training (bloquer si souhaité) des crawlers de recherche live (autoriser pour la visibilité).
KYTIPO whitelist 14 crawlers IA par défaut dans le robots.txt de chaque site livré. Guide llms.txt →