E-mail marketing og automatiseringMarketing værktøjer

Sådan gennemgår du et stort websted og udtrækker data ved hjælp af Screaming Frog's SEO Spider

Vi hjælper flere kunder lige nu med Marketo-migreringer. Da store virksomheder bruger virksomhedsløsninger som denne, er det som et edderkoppespind, der væver sig ind i processer og platforme over år, indtil virksomhederne ikke engang er opmærksomme på alle berøringspunkter.

Med en enterprise marketing automation platform som Marketo er formularer indgangspunktet for data på tværs af websteder og landingssider. Virksomheder har ofte tusindvis af sider og hundredvis af formularer på deres websteder, som skal identificeres for opdatering.

Et godt værktøj til dette er Screaming Frog's SEO Spider… måske den mest populære platform på SEO-markedet til at crawle, revidere og udtrække data fra et websted. Den funktionsrige platform tilbyder hundredvis af muligheder for stort set enhver opgave, du har brug for. Funktionerne strækker sig dog langt ud over optimering til søgning, med en utrolig nyttig funktion til at udtrække data fra dit websted, mens det bliver crawlet.

Screaming Frog SEO Spider: Crawl and Extract

Et nøglefunktion i Screaming Frog SEO Spider er, at du kan udføre brugerdefinerede ekstraktioner baseret på regex, XPath eller CSSPath detaljer. Dette er yderst nyttigt, da vi ønsker at crawle kundens websteder og revidere og fange MunchkinID- og FormId-værdierne fra sider.

Åbn med værktøjet Konfiguration> Brugerdefineret> Ekstraktion for at identificere elementer, du ønsker at udtrække.

skrigende skræddersyet ekstraktion

Ekstraktionsskærmen giver mulighed for næsten ubegrænset dataindsamling:

Regler for skrigende frø SEO Spider Extraction

Regex, XPath og CSSPath Extraction

For MunchkinID'et er identifikatoren placeret i formularscriptet, der er på siden:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Vi anvender derefter en Regex-regel for at fange id'et fra script-tagget, der er indsat på siden:

Regex: ["']id["']: *["'](.*?)["']

For formular-id'et er dataene i et input-tag i Marketo-formularen:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Vi anvender en XPath-regel for at fange id'et fra formularen, der er indsat på siden. XPath-forespørgslen leder efter en formular med et input med navnet på formidelt, så gemmer ekstraktionen værdi:

XPath: //form/input[@name="formid"]/@value

Udtræk Inline Style Tags

Vi hjælper en klient med at rydde op på et websted, hvor de brugte inline-stile på Elementor-plugin'et til at tilpasse stort set hvert element med en side. For at identificere, hvor inline-stile blev brugt, skrabet vi webstedet med adskillige RegEx-regler for tilpasset ekstraktion:

  • Span Inline Style:
<span\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Anchor Tag Inline Style:
<a\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Div Tag Inline Style:
<div\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Indlejret stil til overskriftstag:
<h+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"

Undtagelser

At Martech Zone, vi betjener siden på flere sprog på forskellige underdomæner. Det er ikke nødvendigt at gennemgå disse oversættelser, da alle aktiver og oplysninger er baseret på kernewebstedet. På grund af dette aktiverede vi Ekskluderingslistekonfigurationen og tilføjede følgende regel:

.*\.martech.zone

Du kan også bruge dette til at springe over at crawle unødvendige stier som tags ved at tilføje:

martech.zone/tag/.*

Vi ønsker heller ikke at crawle vores AMP-sider, som ender med ?amp=1, så i

Konfiguration > Ekskluder afsnit, har vi også tilføjet:

https?://[^\s]+?\?amp=1

Platformen har endda en fin metode til at teste nogle URL'er mod reglerne for at sikre, at de fungerer korrekt, før du crawler dit websted.

ScreamingFrog > Konfiguration > Ekskluder

Screaming Frog SEO Spider JavaScript-gengivelse

En anden god mulighed for Screaming Frog er, at du ikke er begrænset til HTML på siden kan du gengive enhver JavaScript, der vil indsætte formularer på dit websted. Inden for Konfiguration> Spider, kan du gå til fanen Rendering og aktivere dette.

Screaming Frog SEO Spider JavaScript-gengivelse

Dette tager selvfølgelig lidt længere tid at gennemgå webstedet, men du får formularer, der gengives klientsiden af ​​JavaScript samt formularer, der indsættes på serversiden.

Selvom dette er en meget specifik applikation, er den utrolig nyttig, da du arbejder med store websteder. Du vil absolut gerne kontrollere, hvor dine formularer er indlejret i hele webstedet.

Download Screaming Frog SEO Spider

Afsløring: Martech Zone bruger sine tilknyttede links i denne artikel.

Douglas Karr

Douglas Karr er CMO for OpenINSIGHTS og grundlæggeren af Martech Zone. Douglas har hjulpet snesevis af succesfulde MarTech-startups, har hjulpet med due diligence på over $5 mia. i Martech-opkøb og -investeringer og fortsætter med at hjælpe virksomheder med at implementere og automatisere deres salgs- og marketingstrategier. Douglas er en internationalt anerkendt digital transformation og MarTech-ekspert og foredragsholder. Douglas er også udgivet forfatter til en Dummies guide og en bog om virksomhedsledelse.

Relaterede artikler

Tilbage til toppen knap
Luk

Adblock fundet

Martech Zone er i stand til at give dig dette indhold uden omkostninger, fordi vi tjener penge på vores websted gennem annonceindtægter, affilierede links og sponsorater. Vi ville sætte pris på, hvis du ville fjerne din annonceblokering, mens du ser vores websted.