Mi a GEO (Generative Engine Optimization)?
A GEO -- Generative Engine Optimization -- egy viszonylag friss fogalom, amely 2024 elején jelent meg a Princeton, Georgia Tech és IIT Delhi kutatóinak közös publikációjában. A hagyományos keresőoptimalizálás (SEO) a Google, Bing és más klasszikus keresők találati listáján való előkelő helyet célozza meg. Az AIO (AI Optimization) a tartalom minőségét formálja úgy, hogy az AI-alapú válaszgeneráló rendszerek -- ChatGPT, Gemini, Perplexity -- forrásként hivatkozzák. A GEO ezektől eltérően kizárólag a technikai rétegre összpontosít.
Mit jelent ez a gyakorlatban? Hiába ír valaki tökéletesen strukturált, szakértői tartalmat, ha a szervere blokkolja az AI crawlereket a robots.txt-ben. Hiába van részletes Schema.org markup, ha a sitemap hiányzik vagy üres. A GEO pillér azt méri, hogy a weboldal technikai beállításai lehetővé teszik-e a generatív AI rendszerek számára a tartalom elérését, feldolgozását és indexelését.
A GEO tehát nem tartalom-optimalizálás. Nem szövegírói feladat. A rendszergazdák, fejlesztők és technikai SEO szakemberek területe: szerverkonfiguráció, fájlok, fejlécek, sémák.
Gondolj rá így
A SEO a bolt kirakatát rendezi el. Az AIO a bolt eladóját tanítja meg, hogyan beszéljen az ügyfelekkel. A GEO pedig kinyitja a bolt ajtaját -- ha zárva van, az eladó hiába készült fel, és a kirakat hiába szép.
SEO vs AIO vs GEO -- mi a különbség?
A három rövidítés könnyen összemosódik, ezért érdemes tisztán elválasztani őket. Mindhárom más célra szolgál, más eszközökkel dolgozik, és más szakértelmet igényel.
SEO (Search Engine Optimization)
Cél: magasabb pozíció a Google/Bing találati listáján. Eszközök: kulcsszavak, backlink-ek, meta tagek, oldalsebsség. Célközönség: emberi felhasználók, akik rákattintanak az eredményre.
AIO (AI Optimization)
Cél: megjelenni az AI válaszgeneráló rendszerek forrásai között. Eszközök: FAQ schema, strukturált adatok, egyértelmű válaszstruktúra, E-E-A-T jelzések. Célközönség: az AI, amely válaszokat generál.
GEO (Generative Engine Optimization)
Cél: technikai hozzáférhetőség biztosítása az AI crawlerek számára. Eszközök: robots.txt, sitemap.xml, llms.txt, HTTP fejlécek, címsor hierarchia. Célközönség: a gépi feldolgozó rendszerek, amelyek bejárják az oldalt.
A három terület egymásra épül. Ha a GEO hiányos -- vagyis az AI crawlerek nem tudják bejárni az oldalt --, az AIO erőfeszítések hiábavalók, mert a tartalom el sem jut a feldolgozó rendszerhez. A SEO önmagában is működik a hagyományos keresőkben, de a generatív keresők térnyerésével a GEO és AIO nélkül egyre több forgalom vész el.
Gyakori félreértés
Sokan gondolják, hogy a „generatív keresőoptimalizálás" a tartalom átírását jelenti. Nem. A GEO a tartalom elérhetőségéről szól, nem a minőségéről. A tartalomminőség az AIO és E-E-A-T pillérek területe.
A GEO pillér mérési pontjai
Az AI Web teszt audit során a GEO pillér összesen 25 pontot ér. Az értékelés kizárólag automatizált, technikai ellenőrzésekre épül -- nem szubjektív, nem tartalomfüggő. Az alábbi táblázat részletezi az egyes mérési területeket és a hozzájuk tartozó pontszámokat:
robots.txt létezik
Elérhető és érvényes robots.txt fájl a domain gyökerében
sitemap.xml létezik
Elérhető és érvényes XML sitemap
Sitemap >10 URL
A sitemap legalább 10 URL-t tartalmaz (nem üres vagy minimális)
SPF DNS rekord
E-mail hitelesítési rekord a domainhez
DMARC DNS rekord
Domain-alapú e-mail hitelesítési házirend
Permissions-Policy fejléc
HTTP fejléc a böngészőfunkciók szabályozásához
Sitemap hivatkozás a robots.txt-ben
Sitemap: direktíva a robots.txt fájlban
PSI SEO pontszám
Google PageSpeed Insights SEO kategória (0--2 pont a pontszám alapján)
llms.txt fájl
LLM-specifikus útmutató fájl a domain gyökerében
AI crawler engedélyezés
GPTBot, ClaudeBot, PerplexityBot stb. nincs blokkolva (1--3 pont a számtól függően)
Címsor hierarchia H1 → H2 → H3
Egyetlen H1, logikus H2/H3 szerkezet az oldalon
Videó beágyazás
Beágyazott videó tartalom az oldalon
Speakable schema
SpeakableSpecification markup a hangalapú kereséshez
Article schema + dateModified
Article típusú JSON-LD markup frissítési dátummal
A pontozás progresszív
Az AI crawler engedélyezés és a PSI SEO pontszám sávosan értékelt: nem „mindent vagy semmit" elven működik. Ha például 2 AI crawlert engedélyezel a háromból, 2 pontot kapsz. A PSI SEO 90 felett 2 pont, 50--89 között 1 pont, alatta 0.
Az llms.txt szabvány
Az llms.txt egy viszonylag új fájlformátum, amelyet Jeremy Howard javasolt 2024 szeptemberében. Hasonlóan a robots.txt-hez, a domain gyökerében helyezkedik el (pl. https://pelda.hu/llms.txt), de más célt szolgál. Míg a robots.txt a crawlereknek mondja meg, mit szabad és mit tilos bejárni, az llms.txt az LLM-eknek ad kontextust arról, hogy mit érdemes feldolgozni.
Az llms.txt Markdown formátumot használ. Tartalmazza a weboldal rövid leírását, a legfontosabb oldalak listáját, és opcionálisan további részleteket. Lényege, hogy egy LLM egyetlen fájlból megértse, miről szól az oldal, és hol találja a legrelevánsabb tartalmat.
Gyakorlati példa
Egy magyar kisvállalkozás llms.txt fájlja így nézhet ki:
# Példa Kft.
> A Példa Kft. budapesti webfejlesztő cég, amely kis- és közepes vállalkozásoknak készít weboldalakat és webshopokat.
## Szolgáltatások
- [Weboldal készítés](https://pelda.hu/szolgaltatasok/weboldal-keszites): Egyedi WordPress és headless megoldások
- [Webshop fejlesztés](https://pelda.hu/szolgaltatasok/webshop): WooCommerce és Shopify alapú webshopok
- [SEO audit](https://pelda.hu/szolgaltatasok/seo-audit): Technikai SEO elemzés és javítás
## Rólunk
- [Csapatunk](https://pelda.hu/rolunk): 12 fős fejlesztőcsapat, 8 év tapasztalat
- [Referenciák](https://pelda.hu/referenciak): 200+ elkészült projekt
## Kapcsolat
- [Ajánlatkérés](https://pelda.hu/kapcsolat): Ingyenes konzultáció
Az audit 3 pontot ad az llms.txt fájl meglétéért. Nem vizsgálja a tartalmát részletesen -- a lényeg, hogy létezik, elérhető, és nem üres. A jövőben várhatóan ez a szabvány tovább finomodik, ahogy az LLM-szolgáltatók (OpenAI, Anthropic, Google) egyre több kontextust fognak keresni a crawlolás során.
Az llms.txt nem helyettesíti a robots.txt-t
A két fájl más-más szerepet tölt be. A robots.txt szabályoz (engedélyez vagy tilt), az llms.txt tájékoztat (kontextust ad). Mindkettőre szükség van a teljes GEO pontszámhoz.
AI crawlerek kezelése a robots.txt-ben
A generatív AI rendszerek saját crawlerekkel járják be az internetet. Ezek a botok a robots.txt fájl alapján döntik el, melyik oldalt olvashatják be és melyiket nem. Ha egy weboldal tulajdonosa blokkolja ezeket a crawlereket, a tartalom nem jut el az AI rendszerekbe -- és az AI válaszokban sem fog megjelenni.
Az audit által vizsgált AI crawlerek
Az AI Web teszt audit a következő botokat ellenőrzi:
- GPTBot -- Az OpenAI crawlere. A ChatGPT és más OpenAI termékek számára gyűjt adatot. A
User-agent: GPTBotazonosítóval dolgozik. - ClaudeBot -- Az Anthropic crawlere a Claude modellcsalád számára. Viszonylag új: 2024 közepétől aktív.
- Google-Extended -- A Google Gemini és Bard betanításához használt crawler. A hagyományos Googlebot-tól független, külön kezelhető.
- PerplexityBot -- A Perplexity AI keresőmotor crawlere, amely valós idejű válaszgeneráláshoz használja a begyűjtött tartalmat.
- Bytespider -- A ByteDance (TikTok anyacég) crawlere, amely egyre aktívabb az AI betanítás területén.
- anthropic-ai -- Az Anthropic másodlagos crawler-azonosítója.
- CCBot -- A Common Crawl projekt botja, amelynek adatait számos AI rendszer betanításához használják.
Hogyan működik a pontozás?
Az audit megvizsgálja a robots.txt fájlt, és megszámolja, hány AI crawler van engedélyezve (nincs kifejezetten blokkolva). A pontszám a következőképpen alakul:
- 1 pont: legalább 1 AI crawler engedélyezett
- 2 pont: legalább 3 AI crawler engedélyezett
- 3 pont: 5 vagy több AI crawler engedélyezett
Példa: engedélyezés
Ha a robots.txt fájlod nem tartalmaz explicit tiltást az AI crawlerekre, az alapértelmezetten engedélyezett. Egy egyszerű, AI-barát robots.txt:
User-agent: *
Allow: /
Sitemap: https://pelda.hu/sitemap.xml
Ez az összes crawlert -- beleértve az AI botokat is -- beengedi. Viszont ha célzottan akarod engedélyezni:
User-agent: GPTBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: Google-Extended
Allow: /
User-agent: PerplexityBot
Allow: /
Sitemap: https://pelda.hu/sitemap.xml
A blokkolás ára
Egyes tartalomszolgáltatók (pl. hírportálok, kiadók) tudatosan blokkolják az AI crawlereket szerzői jogi okokból. Ez jogos döntés lehet -- de a GEO pillérben pontlevonással jár, mert az audit a technikai hozzáférhetőséget méri, nem a döntés indokoltságát. Ha blokkoltad a GPTBot-ot, a ChatGPT nem fogja forrásként hivatkozni a tartalmaidat.
Címsor hierarchia és tartalomszerkezet
Az AI rendszerek számára a HTML címsorok (H1, H2, H3) a tartalom vázát adják. Ahogy egy könyv tartalomjegyzéke segíti az olvasót, a címsor hierarchia segíti a gépet abban, hogy megértse a tartalom struktúráját, a témák egymáshoz való viszonyát és az információk fontossági sorrendjét.
Az audit két szempontot vizsgál, összesen 2 pontért:
- Egyetlen H1 címsor: Az oldalon pontosan egy
<h1>tag legyen. Ez a fő téma. Több H1 zavart okoz: a crawler nem tudja eldönteni, melyik az oldal elsődleges témája. - Logikus H2/H3 sorrend: A H2-es címsorok a fő szekciók, a H3-asok az alszekciók. Tilos szintet ugrani (pl. H1 után közvetlenül H4), mert ez sérült dokumentumszerkezetre utal.
A helyes címsor hierarchia így néz ki:
H1: Az oldal fő címe
H2: Első fejezet
H3: Első alfejezet
H3: Második alfejezet
H2: Második fejezet
H3: Alfejezet
H2: Harmadik fejezet
A hibás szerkezet -- például három H1, vagy H1 → H3 ugrás H2 kihagyásával -- nem feltétlenül látszik a felhasználónak, de az AI crawler számára a tartalom inkoherensnek tűnik. Az LLM-ek a címsorokból építik fel a tartalom „mentális térképét". Ha ez a térkép hiányos, a tartalom feldolgozása pontatlanabb lesz.
Gyors ellenőrzés
Nyisd meg a böngésző fejlesztői eszközeit (F12), majd a konzolon futtasd: document.querySelectorAll('h1,h2,h3,h4').forEach(h => console.log(h.tagName, h.textContent.trim())). Azonnal látod a címsorszerkezetet, szintugrásokkal együtt.
Speakable schema és egyéb technikai jelzések
A GEO pillér utolsó három mérési pontja az oldalon megjelenő technikai jelzéseket vizsgálja: Speakable schema, videó beágyazás és Article schema frissítési dátummal. Külön-külön kicsinek tűnhetnek (1-1 pont), de együtt jelzik, hogy az oldal aktívan törekszik a gépi feldolgozhatóságra.
Speakable schema (+1 pont)
A SpeakableSpecification a Schema.org egy speciális típusa, amely megmondja a hangalapú asszisztenseknek (Google Assistant, Alexa, Siri), mely szövegrészeket érdemes felolvasni. A JSON-LD markup CSS selectorokkal vagy XPath kifejezésekkel jelöli ki a felolvasható elemeket.
Példa:
{
"@context": "https://schema.org",
"@type": "WebPage",
"name": "Oldal címe",
"speakable": {
"@type": "SpeakableSpecification",
"cssSelector": ["#article-title", "#article-lead"]
}
}
A Speakable schema nem csak a hangkeresés miatt érdekes. Az AI válaszgeneráló rendszerek is figyelembe veszik: ha az oldal egyértelműen kijelöli, melyik szövegrész a „lényeg", az AI könnyebben azonosítja a releváns választ.
Videó beágyazás (+1 pont)
Az audit vizsgálja, hogy az oldalon található-e beágyazott videó tartalom (<video> tag, YouTube/Vimeo embed, vagy VideoObject schema). A videó jelenléte nem közvetlenül a gépi feldolgozhatóságot segíti, hanem tartalmi gazdagságot jelez. A Google „kevert" (multimodális) tartalmat preferálja, és az AI keresők is hajlamosabbak forrásként választani az olyan oldalakat, amelyek szöveget és videót egyaránt tartalmaznak.
Article schema + dateModified (+1 pont)
Az Article típusú JSON-LD markup a tartalom metaadatait írja le: cím, szerző, kiadó, megjelenési dátum. Az audit különösen a dateModified mezőt keresi, mert ez jelzi a frissességet. Egy AI rendszer számára nagy különbség, hogy a cikk utoljára 2019-ben vagy 2026-ban frissült -- a frissebb tartalom nagyobb eséllyel kerül be a válaszokba.
Automatizáld a dateModified frissítést
Ha CMS-t (WordPress, Joomla) használsz, a legtöbb SEO bővítmény (Yoast, Rank Math) automatikusan frissíti a dateModified értéket mentéskor. Ha egyedi fejlesztésű az oldalad, írd be a build vagy deploy scriptedbe, hogy a JSON-LD dateModified értékét az aktuális dátumra állítsa.
Gyakorlati lépések -- teendők listája
Az alábbi lista a GEO pillér maximális pontszámának eléréséhez szükséges lépéseket tartalmazza, fontossági sorrendben. Haladj felülről lefelé: az első lépések adják a legtöbb pontot, az utolsók pedig finomhangolnak.
-
Ellenőrizd a robots.txt fájlt: Nyisd meg a
https://sajatdomain.hu/robots.txtURL-t. Ha 404-es hibát ad, hozd létre a domain webgyökerében. Győződj meg róla, hogy nincs benneDisallow: /az AI crawlerekre. Ha nem akarsz célzottan tiltani, a legegyszerűbb:User-agent: */Allow: /. Adj hozzá egySitemap:sort is. -
Hozd létre vagy frissítsd a sitemap.xml-t: A sitemap legyen elérhető a
/sitemap.xmlútvonalon. Tartalmazzon legalább 10 URL-t. WordPress esetén a Yoast vagy Rank Math automatikusan generálja. Egyedi oldalaknál használj sitemap-generátor eszközt, vagy kézzel írd meg az XML-t. A sitemap URL-je legyen hivatkozva a robots.txt-ben is. -
Készíts llms.txt fájlt: Hozd létre a
/llms.txtfájlt a domain gyökerében. Markdown formátumban írd meg: rövid bemutatkozás a cégről/oldalról, majd a legfontosabb oldalak listája linkkel és egysoros leírással. Nem kell hosszú legyen -- 20-30 sor bőven elég. -
Állítsd be a DNS rekordokat: Az SPF rekordot a TXT DNS-ben kell megadni (pl.
v=spf1 include:_spf.google.com ~all). A DMARC-ot szintén TXT rekordként:_dmarc.sajatdomain.hunévre (pl.v=DMARC1; p=none; rua=mailto:dmarc@sajatdomain.hu). Ha már van e-mail szolgáltatásod, valószínűleg az SPF már be van állítva -- a DMARC-ot viszont gyakran elfelejtik. -
Javítsd a címsorszerkezetet: Ellenőrizd, hogy az oldalon pontosan egy
<h1>tag legyen. Nézd végig a H2/H3 sorrendet: ne ugorj szintet, és ne használj címsor tageket pusztán vizuális formázásra (arra CSS van). Ha WordPress témát használsz, gyakori, hogy a widgetek vagy a lábléc tartalmaz rejtett H2/H3 elemeket -- ezeket is ellenőrizd. -
Adj hozzá Speakable schema-t: A JSON-LD markupot a
<head>szekcióba illeszd be. Jelöld ki a cím és a bevezető bekezdés CSS selectorait. Ez egyetlen<script type="application/ld+json">blokkot igényel -- nem bonyolult, de sok weboldal egyáltalán nem használja. -
Adj hozzá Article schema-t dateModified mezővel: Ha az oldalon cikkek, blog bejegyzések vannak, minden cikkhez adj hozzá Article típusú JSON-LD-t. A
datePublishedésdateModifiedmezők egyaránt kellenek. Ha a tartalom frissül, a dateModified-ot is frissítsd. -
Ágyazz be videót legalább egy oldalra: Ha van YouTube csatornád vagy bemutatkozó videód, ágyazd be a szolgáltatások vagy rólunk oldalra. Opcionálisan adj hozzá
VideoObjectschema-t is, bár az audit a beágyazás tényét vizsgálja, nem a sémát. -
Állítsd be a Permissions-Policy fejlécet: Ez az Nginx vagy Apache szerver konfigurációjában történik. Példa Nginx-hez:
add_header Permissions-Policy "camera=(), microphone=(), geolocation=()";. Ez jelzi a böngészőnek és a crawlereknek, hogy az oldal nem kér felesleges böngészőengedélyeket. - Ellenőrizd a PSI SEO pontszámot: Futtasd le a Google PageSpeed Insights eszközben az oldaladat, és nézd a SEO kategóriát. A 90 feletti pontszám 2 GEO pontot ér. A tipikus problémák: hiányzó meta description, nem megfelelő viewport meta tag, nem crawlolható linkek. Ezek általában gyorsan javíthatók.
Prioritás kérdése
Ha időd korlátozott, az első három lépés (robots.txt, sitemap, llms.txt) adja a 25-ből 10 pontot -- az összpontszám 40%-át. Ezek ráadásul gyorsan, szerver-hozzáférés nélkül is megoldhatók, ha FTP vagy fájlkezelő hozzáférésed van.
Ne feledd a többi pillért
A GEO pillér a technikai alapot biztosítja, de önmagában nem elég. A maximális AI Web teszt pontszámhoz a Core Web Vitals (teljesítmény), az E-E-A-T (megbízhatóság) és az AIO (tartalom-optimalizálás) pillérek is szükségesek. A négy pillér együtt 100 pontot ér.
Kíváncsi vagy a weboldalad GEO pontszámára?
Futtasd le az ingyenes AI Web teszt auditot, és pár másodperc alatt megkapod a részletes értékelést mind a 4 pillérben -- beleértve a GEO technikai felkészültséget is.
Vagy töltsd le az Optimalizálási Sablon HTML-t -- az összes szükséges meta tag, schema és struktúra egy fájlban.