GEO Felkészültség -- 25 pont

GEO: A generatív keresők technikai kiszolgálása

A GEO (Generative Engine Optimization) az AI Web teszt negyedik pillére, amely kizárólag a technikai infrastruktúrát vizsgálja: eléri-e egyáltalán a tartalmad egy generatív AI rendszer? Nem a tartalomról szól, nem a szavakról -- hanem arról, hogy a robots.txt, a sitemap, az llms.txt, a fejlécek és a sémák együttesen megnyitják-e az ajtót a GPTBot, a ClaudeBot vagy a PerplexityBot előtt. Ha ezek a technikai kapuk zárva vannak, a legjobb tartalom sem jelenik meg az AI válaszokban.

Maximális pontszám: 25 pont

Mi a GEO (Generative Engine Optimization)?

A GEO -- Generative Engine Optimization -- egy viszonylag friss fogalom, amely 2024 elején jelent meg a Princeton, Georgia Tech és IIT Delhi kutatóinak közös publikációjában. A hagyományos keresőoptimalizálás (SEO) a Google, Bing és más klasszikus keresők találati listáján való előkelő helyet célozza meg. Az AIO (AI Optimization) a tartalom minőségét formálja úgy, hogy az AI-alapú válaszgeneráló rendszerek -- ChatGPT, Gemini, Perplexity -- forrásként hivatkozzák. A GEO ezektől eltérően kizárólag a technikai rétegre összpontosít.

Mit jelent ez a gyakorlatban? Hiába ír valaki tökéletesen strukturált, szakértői tartalmat, ha a szervere blokkolja az AI crawlereket a robots.txt-ben. Hiába van részletes Schema.org markup, ha a sitemap hiányzik vagy üres. A GEO pillér azt méri, hogy a weboldal technikai beállításai lehetővé teszik-e a generatív AI rendszerek számára a tartalom elérését, feldolgozását és indexelését.

A GEO tehát nem tartalom-optimalizálás. Nem szövegírói feladat. A rendszergazdák, fejlesztők és technikai SEO szakemberek területe: szerverkonfiguráció, fájlok, fejlécek, sémák.

Gondolj rá így

A SEO a bolt kirakatát rendezi el. Az AIO a bolt eladóját tanítja meg, hogyan beszéljen az ügyfelekkel. A GEO pedig kinyitja a bolt ajtaját -- ha zárva van, az eladó hiába készült fel, és a kirakat hiába szép.

SEO vs AIO vs GEO -- mi a különbség?

A három rövidítés könnyen összemosódik, ezért érdemes tisztán elválasztani őket. Mindhárom más célra szolgál, más eszközökkel dolgozik, és más szakértelmet igényel.

SEO (Search Engine Optimization)

Cél: magasabb pozíció a Google/Bing találati listáján. Eszközök: kulcsszavak, backlink-ek, meta tagek, oldalsebsség. Célközönség: emberi felhasználók, akik rákattintanak az eredményre.

AIO (AI Optimization)

Cél: megjelenni az AI válaszgeneráló rendszerek forrásai között. Eszközök: FAQ schema, strukturált adatok, egyértelmű válaszstruktúra, E-E-A-T jelzések. Célközönség: az AI, amely válaszokat generál.

GEO (Generative Engine Optimization)

Cél: technikai hozzáférhetőség biztosítása az AI crawlerek számára. Eszközök: robots.txt, sitemap.xml, llms.txt, HTTP fejlécek, címsor hierarchia. Célközönség: a gépi feldolgozó rendszerek, amelyek bejárják az oldalt.

A három terület egymásra épül. Ha a GEO hiányos -- vagyis az AI crawlerek nem tudják bejárni az oldalt --, az AIO erőfeszítések hiábavalók, mert a tartalom el sem jut a feldolgozó rendszerhez. A SEO önmagában is működik a hagyományos keresőkben, de a generatív keresők térnyerésével a GEO és AIO nélkül egyre több forgalom vész el.

Gyakori félreértés

Sokan gondolják, hogy a „generatív keresőoptimalizálás" a tartalom átírását jelenti. Nem. A GEO a tartalom elérhetőségéről szól, nem a minőségéről. A tartalomminőség az AIO és E-E-A-T pillérek területe.

A GEO pillér mérési pontjai

Az AI Web teszt audit során a GEO pillér összesen 25 pontot ér. Az értékelés kizárólag automatizált, technikai ellenőrzésekre épül -- nem szubjektív, nem tartalomfüggő. Az alábbi táblázat részletezi az egyes mérési területeket és a hozzájuk tartozó pontszámokat:

robots.txt létezik

Elérhető és érvényes robots.txt fájl a domain gyökerében

+3

sitemap.xml létezik

Elérhető és érvényes XML sitemap

+3

Sitemap >10 URL

A sitemap legalább 10 URL-t tartalmaz (nem üres vagy minimális)

+1

SPF DNS rekord

E-mail hitelesítési rekord a domainhez

+1

DMARC DNS rekord

Domain-alapú e-mail hitelesítési házirend

+1

Permissions-Policy fejléc

HTTP fejléc a böngészőfunkciók szabályozásához

+1

Sitemap hivatkozás a robots.txt-ben

Sitemap: direktíva a robots.txt fájlban

+1

PSI SEO pontszám

Google PageSpeed Insights SEO kategória (0--2 pont a pontszám alapján)

0--2

llms.txt fájl

LLM-specifikus útmutató fájl a domain gyökerében

+3

AI crawler engedélyezés

GPTBot, ClaudeBot, PerplexityBot stb. nincs blokkolva (1--3 pont a számtól függően)

1--3

Címsor hierarchia H1 → H2 → H3

Egyetlen H1, logikus H2/H3 szerkezet az oldalon

+2

Videó beágyazás

Beágyazott videó tartalom az oldalon

+1

Speakable schema

SpeakableSpecification markup a hangalapú kereséshez

+1

Article schema + dateModified

Article típusú JSON-LD markup frissítési dátummal

+1
Összesen 25 pont

A pontozás progresszív

Az AI crawler engedélyezés és a PSI SEO pontszám sávosan értékelt: nem „mindent vagy semmit" elven működik. Ha például 2 AI crawlert engedélyezel a háromból, 2 pontot kapsz. A PSI SEO 90 felett 2 pont, 50--89 között 1 pont, alatta 0.

Az llms.txt szabvány

Az llms.txt egy viszonylag új fájlformátum, amelyet Jeremy Howard javasolt 2024 szeptemberében. Hasonlóan a robots.txt-hez, a domain gyökerében helyezkedik el (pl. https://pelda.hu/llms.txt), de más célt szolgál. Míg a robots.txt a crawlereknek mondja meg, mit szabad és mit tilos bejárni, az llms.txt az LLM-eknek ad kontextust arról, hogy mit érdemes feldolgozni.

Az llms.txt Markdown formátumot használ. Tartalmazza a weboldal rövid leírását, a legfontosabb oldalak listáját, és opcionálisan további részleteket. Lényege, hogy egy LLM egyetlen fájlból megértse, miről szól az oldal, és hol találja a legrelevánsabb tartalmat.

Gyakorlati példa

Egy magyar kisvállalkozás llms.txt fájlja így nézhet ki:

# Példa Kft. > A Példa Kft. budapesti webfejlesztő cég, amely kis- és közepes vállalkozásoknak készít weboldalakat és webshopokat. ## Szolgáltatások - [Weboldal készítés](https://pelda.hu/szolgaltatasok/weboldal-keszites): Egyedi WordPress és headless megoldások - [Webshop fejlesztés](https://pelda.hu/szolgaltatasok/webshop): WooCommerce és Shopify alapú webshopok - [SEO audit](https://pelda.hu/szolgaltatasok/seo-audit): Technikai SEO elemzés és javítás ## Rólunk - [Csapatunk](https://pelda.hu/rolunk): 12 fős fejlesztőcsapat, 8 év tapasztalat - [Referenciák](https://pelda.hu/referenciak): 200+ elkészült projekt ## Kapcsolat - [Ajánlatkérés](https://pelda.hu/kapcsolat): Ingyenes konzultáció

Az audit 3 pontot ad az llms.txt fájl meglétéért. Nem vizsgálja a tartalmát részletesen -- a lényeg, hogy létezik, elérhető, és nem üres. A jövőben várhatóan ez a szabvány tovább finomodik, ahogy az LLM-szolgáltatók (OpenAI, Anthropic, Google) egyre több kontextust fognak keresni a crawlolás során.

Az llms.txt nem helyettesíti a robots.txt-t

A két fájl más-más szerepet tölt be. A robots.txt szabályoz (engedélyez vagy tilt), az llms.txt tájékoztat (kontextust ad). Mindkettőre szükség van a teljes GEO pontszámhoz.

AI crawlerek kezelése a robots.txt-ben

A generatív AI rendszerek saját crawlerekkel járják be az internetet. Ezek a botok a robots.txt fájl alapján döntik el, melyik oldalt olvashatják be és melyiket nem. Ha egy weboldal tulajdonosa blokkolja ezeket a crawlereket, a tartalom nem jut el az AI rendszerekbe -- és az AI válaszokban sem fog megjelenni.

Az audit által vizsgált AI crawlerek

Az AI Web teszt audit a következő botokat ellenőrzi:

  • GPTBot -- Az OpenAI crawlere. A ChatGPT és más OpenAI termékek számára gyűjt adatot. A User-agent: GPTBot azonosítóval dolgozik.
  • ClaudeBot -- Az Anthropic crawlere a Claude modellcsalád számára. Viszonylag új: 2024 közepétől aktív.
  • Google-Extended -- A Google Gemini és Bard betanításához használt crawler. A hagyományos Googlebot-tól független, külön kezelhető.
  • PerplexityBot -- A Perplexity AI keresőmotor crawlere, amely valós idejű válaszgeneráláshoz használja a begyűjtött tartalmat.
  • Bytespider -- A ByteDance (TikTok anyacég) crawlere, amely egyre aktívabb az AI betanítás területén.
  • anthropic-ai -- Az Anthropic másodlagos crawler-azonosítója.
  • CCBot -- A Common Crawl projekt botja, amelynek adatait számos AI rendszer betanításához használják.

Hogyan működik a pontozás?

Az audit megvizsgálja a robots.txt fájlt, és megszámolja, hány AI crawler van engedélyezve (nincs kifejezetten blokkolva). A pontszám a következőképpen alakul:

  • 1 pont: legalább 1 AI crawler engedélyezett
  • 2 pont: legalább 3 AI crawler engedélyezett
  • 3 pont: 5 vagy több AI crawler engedélyezett

Példa: engedélyezés

Ha a robots.txt fájlod nem tartalmaz explicit tiltást az AI crawlerekre, az alapértelmezetten engedélyezett. Egy egyszerű, AI-barát robots.txt:

User-agent: * Allow: / Sitemap: https://pelda.hu/sitemap.xml

Ez az összes crawlert -- beleértve az AI botokat is -- beengedi. Viszont ha célzottan akarod engedélyezni:

User-agent: GPTBot Allow: / User-agent: ClaudeBot Allow: / User-agent: Google-Extended Allow: / User-agent: PerplexityBot Allow: / Sitemap: https://pelda.hu/sitemap.xml

A blokkolás ára

Egyes tartalomszolgáltatók (pl. hírportálok, kiadók) tudatosan blokkolják az AI crawlereket szerzői jogi okokból. Ez jogos döntés lehet -- de a GEO pillérben pontlevonással jár, mert az audit a technikai hozzáférhetőséget méri, nem a döntés indokoltságát. Ha blokkoltad a GPTBot-ot, a ChatGPT nem fogja forrásként hivatkozni a tartalmaidat.

Címsor hierarchia és tartalomszerkezet

Az AI rendszerek számára a HTML címsorok (H1, H2, H3) a tartalom vázát adják. Ahogy egy könyv tartalomjegyzéke segíti az olvasót, a címsor hierarchia segíti a gépet abban, hogy megértse a tartalom struktúráját, a témák egymáshoz való viszonyát és az információk fontossági sorrendjét.

Az audit két szempontot vizsgál, összesen 2 pontért:

  • Egyetlen H1 címsor: Az oldalon pontosan egy <h1> tag legyen. Ez a fő téma. Több H1 zavart okoz: a crawler nem tudja eldönteni, melyik az oldal elsődleges témája.
  • Logikus H2/H3 sorrend: A H2-es címsorok a fő szekciók, a H3-asok az alszekciók. Tilos szintet ugrani (pl. H1 után közvetlenül H4), mert ez sérült dokumentumszerkezetre utal.

A helyes címsor hierarchia így néz ki:

H1: Az oldal fő címe H2: Első fejezet H3: Első alfejezet H3: Második alfejezet H2: Második fejezet H3: Alfejezet H2: Harmadik fejezet

A hibás szerkezet -- például három H1, vagy H1 → H3 ugrás H2 kihagyásával -- nem feltétlenül látszik a felhasználónak, de az AI crawler számára a tartalom inkoherensnek tűnik. Az LLM-ek a címsorokból építik fel a tartalom „mentális térképét". Ha ez a térkép hiányos, a tartalom feldolgozása pontatlanabb lesz.

Gyors ellenőrzés

Nyisd meg a böngésző fejlesztői eszközeit (F12), majd a konzolon futtasd: document.querySelectorAll('h1,h2,h3,h4').forEach(h => console.log(h.tagName, h.textContent.trim())). Azonnal látod a címsorszerkezetet, szintugrásokkal együtt.

Speakable schema és egyéb technikai jelzések

A GEO pillér utolsó három mérési pontja az oldalon megjelenő technikai jelzéseket vizsgálja: Speakable schema, videó beágyazás és Article schema frissítési dátummal. Külön-külön kicsinek tűnhetnek (1-1 pont), de együtt jelzik, hogy az oldal aktívan törekszik a gépi feldolgozhatóságra.

Speakable schema (+1 pont)

A SpeakableSpecification a Schema.org egy speciális típusa, amely megmondja a hangalapú asszisztenseknek (Google Assistant, Alexa, Siri), mely szövegrészeket érdemes felolvasni. A JSON-LD markup CSS selectorokkal vagy XPath kifejezésekkel jelöli ki a felolvasható elemeket.

Példa:

{ "@context": "https://schema.org", "@type": "WebPage", "name": "Oldal címe", "speakable": { "@type": "SpeakableSpecification", "cssSelector": ["#article-title", "#article-lead"] } }

A Speakable schema nem csak a hangkeresés miatt érdekes. Az AI válaszgeneráló rendszerek is figyelembe veszik: ha az oldal egyértelműen kijelöli, melyik szövegrész a „lényeg", az AI könnyebben azonosítja a releváns választ.

Videó beágyazás (+1 pont)

Az audit vizsgálja, hogy az oldalon található-e beágyazott videó tartalom (<video> tag, YouTube/Vimeo embed, vagy VideoObject schema). A videó jelenléte nem közvetlenül a gépi feldolgozhatóságot segíti, hanem tartalmi gazdagságot jelez. A Google „kevert" (multimodális) tartalmat preferálja, és az AI keresők is hajlamosabbak forrásként választani az olyan oldalakat, amelyek szöveget és videót egyaránt tartalmaznak.

Article schema + dateModified (+1 pont)

Az Article típusú JSON-LD markup a tartalom metaadatait írja le: cím, szerző, kiadó, megjelenési dátum. Az audit különösen a dateModified mezőt keresi, mert ez jelzi a frissességet. Egy AI rendszer számára nagy különbség, hogy a cikk utoljára 2019-ben vagy 2026-ban frissült -- a frissebb tartalom nagyobb eséllyel kerül be a válaszokba.

Automatizáld a dateModified frissítést

Ha CMS-t (WordPress, Joomla) használsz, a legtöbb SEO bővítmény (Yoast, Rank Math) automatikusan frissíti a dateModified értéket mentéskor. Ha egyedi fejlesztésű az oldalad, írd be a build vagy deploy scriptedbe, hogy a JSON-LD dateModified értékét az aktuális dátumra állítsa.

Gyakorlati lépések -- teendők listája

Az alábbi lista a GEO pillér maximális pontszámának eléréséhez szükséges lépéseket tartalmazza, fontossági sorrendben. Haladj felülről lefelé: az első lépések adják a legtöbb pontot, az utolsók pedig finomhangolnak.

  1. Ellenőrizd a robots.txt fájlt: Nyisd meg a https://sajatdomain.hu/robots.txt URL-t. Ha 404-es hibát ad, hozd létre a domain webgyökerében. Győződj meg róla, hogy nincs benne Disallow: / az AI crawlerekre. Ha nem akarsz célzottan tiltani, a legegyszerűbb: User-agent: * / Allow: /. Adj hozzá egy Sitemap: sort is.
  2. Hozd létre vagy frissítsd a sitemap.xml-t: A sitemap legyen elérhető a /sitemap.xml útvonalon. Tartalmazzon legalább 10 URL-t. WordPress esetén a Yoast vagy Rank Math automatikusan generálja. Egyedi oldalaknál használj sitemap-generátor eszközt, vagy kézzel írd meg az XML-t. A sitemap URL-je legyen hivatkozva a robots.txt-ben is.
  3. Készíts llms.txt fájlt: Hozd létre a /llms.txt fájlt a domain gyökerében. Markdown formátumban írd meg: rövid bemutatkozás a cégről/oldalról, majd a legfontosabb oldalak listája linkkel és egysoros leírással. Nem kell hosszú legyen -- 20-30 sor bőven elég.
  4. Állítsd be a DNS rekordokat: Az SPF rekordot a TXT DNS-ben kell megadni (pl. v=spf1 include:_spf.google.com ~all). A DMARC-ot szintén TXT rekordként: _dmarc.sajatdomain.hu névre (pl. v=DMARC1; p=none; rua=mailto:dmarc@sajatdomain.hu). Ha már van e-mail szolgáltatásod, valószínűleg az SPF már be van állítva -- a DMARC-ot viszont gyakran elfelejtik.
  5. Javítsd a címsorszerkezetet: Ellenőrizd, hogy az oldalon pontosan egy <h1> tag legyen. Nézd végig a H2/H3 sorrendet: ne ugorj szintet, és ne használj címsor tageket pusztán vizuális formázásra (arra CSS van). Ha WordPress témát használsz, gyakori, hogy a widgetek vagy a lábléc tartalmaz rejtett H2/H3 elemeket -- ezeket is ellenőrizd.
  6. Adj hozzá Speakable schema-t: A JSON-LD markupot a <head> szekcióba illeszd be. Jelöld ki a cím és a bevezető bekezdés CSS selectorait. Ez egyetlen <script type="application/ld+json"> blokkot igényel -- nem bonyolult, de sok weboldal egyáltalán nem használja.
  7. Adj hozzá Article schema-t dateModified mezővel: Ha az oldalon cikkek, blog bejegyzések vannak, minden cikkhez adj hozzá Article típusú JSON-LD-t. A datePublished és dateModified mezők egyaránt kellenek. Ha a tartalom frissül, a dateModified-ot is frissítsd.
  8. Ágyazz be videót legalább egy oldalra: Ha van YouTube csatornád vagy bemutatkozó videód, ágyazd be a szolgáltatások vagy rólunk oldalra. Opcionálisan adj hozzá VideoObject schema-t is, bár az audit a beágyazás tényét vizsgálja, nem a sémát.
  9. Állítsd be a Permissions-Policy fejlécet: Ez az Nginx vagy Apache szerver konfigurációjában történik. Példa Nginx-hez: add_header Permissions-Policy "camera=(), microphone=(), geolocation=()";. Ez jelzi a böngészőnek és a crawlereknek, hogy az oldal nem kér felesleges böngészőengedélyeket.
  10. Ellenőrizd a PSI SEO pontszámot: Futtasd le a Google PageSpeed Insights eszközben az oldaladat, és nézd a SEO kategóriát. A 90 feletti pontszám 2 GEO pontot ér. A tipikus problémák: hiányzó meta description, nem megfelelő viewport meta tag, nem crawlolható linkek. Ezek általában gyorsan javíthatók.

Prioritás kérdése

Ha időd korlátozott, az első három lépés (robots.txt, sitemap, llms.txt) adja a 25-ből 10 pontot -- az összpontszám 40%-át. Ezek ráadásul gyorsan, szerver-hozzáférés nélkül is megoldhatók, ha FTP vagy fájlkezelő hozzáférésed van.

Ne feledd a többi pillért

A GEO pillér a technikai alapot biztosítja, de önmagában nem elég. A maximális AI Web teszt pontszámhoz a Core Web Vitals (teljesítmény), az E-E-A-T (megbízhatóság) és az AIO (tartalom-optimalizálás) pillérek is szükségesek. A négy pillér együtt 100 pontot ér.

Kíváncsi vagy a weboldalad GEO pontszámára?

Futtasd le az ingyenes AI Web teszt auditot, és pár másodperc alatt megkapod a részletes értékelést mind a 4 pillérben -- beleértve a GEO technikai felkészültséget is.

Vagy töltsd le az Optimalizálási Sablon HTML-t -- az összes szükséges meta tag, schema és struktúra egy fájlban.

További cikkek a Tudástárból