Cume Crawl Un Grande Site è Estrazione di Dati Usendu Screaming Frog's SEO Spider

Screaming Frog SEO Spider

Aiutemu parechji clienti avà cù Migrazzioni Marketo. Cum'è e grandi imprese utilizanu soluzioni d'impresa cum'è questu, hè cum'è una ragnatela chì si intreccia in prucessi è piattaforme durante anni ... finu à u puntu chì e cumpagnie ùn sò mancu cuscenti di ogni puntu di cuntattu.

Cù una piattaforma di automazione di marketing di l'impresa cum'è Marketo, e forme sò u puntu d'entrata di dati in tutti i siti è pagine di destinazione. E cumpagnie anu spessu migliaia di pagine è centinaie di forme in i so siti chì devenu esse identificati per l'aghjurnamentu.

Un grande strumentu per questu hè Screaming Frog's SEO Spider... forse a piattaforma a più pupulare in u mercatu per striscia, audità, è estrazione di dati da un situ. A piattaforma hè ricca di funzionalità è offre centinaie d'opzioni per praticamente ogni compitu chì avete bisognu.

Screaming Frog SEO Spider: Crawl And Extract

Una caratteristica chjave di Screaming Frog SEO Spider hè chì pudete eseguisce estrazzioni persunalizate basatu annantu Regex, XPath, o CSSPath specificità. Questu vene estremamente utile cume vulemu scansà i siti di u cliente è verificà è catturà i valori MunchkinID è FormId da e pagine.

Cù u strumentu, aprite Configurazione> Personalizatu> Estrazione per identificà elementi chì vulete estrarre.

screamingfrog estrazione persunalizata

A schermata di estrazione permette una raccolta di dati virtualmente illimitata:

Screaming Frog SEO Spider Rules Extraction

Estrazione Regex, XPath è CSSPath

Per u MunchkinID, l'identificatore hè situatu in u script di forma chì hè in a pagina:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Dopu dumandemu a Regula regula per catturà l'id da u tag script chì hè inseritu in a pagina:

Regex: ["']id["']: *["'](.*?)["']

Per l'ID di Forma, i dati sò in un tag di input in a forma Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Dumandemu un Regula XPath per catturà l'id da a forma inserita in a pagina. A quistione XPath cerca una forma cù un input cun un nome di formid, allora l'estrazione salva u valore:

XPath: //form/input[@name="formid"]/@value

Screaming Frog SEO Spider Rendu Javascript

Una altra grande opzione di Screaming Frog hè chì ùn site micca limitatu à l'HTML in a pagina, pudete rende qualsiasi JavaScript chì hà da inserisce forme in u vostru situ. Dentru Configurazione> Spider, pudete andà à a tabulazione Rendu è attivà questu.

Screaming Frog SEO Spider Rendu Javascript

Questu ci vole un pocu di più per scansià u situ, benintesa, ma uttenerete forme chì sò rese latu client da JavaScript cum'è forme chì sò inserite latu server.

Mentre hè una applicazione assai specifica, hè incredibilmente utile quandu travagliate cù siti grandi. Vulete assolutamente verificà induve e vostre forme sò incrustate in tuttu u situ.

Scaricate Screaming Frog SEO Spider

Chì ne pensi?

Stu situ utilizeghja Akismet per reducisce u puzzicheghju. Sapete ciò chì i dati di i vostri dati è processatu.