WooRank. Instrument online pentru analiza site-urilor
După o pauză ceva mai lungă decât mi-aş fi dorit, revin cu un articol ce marchează totodată debutul unei noi categorii, aceea a instrumentelor online. Sigur, atunci când am vorbit despre VirusTotal sau am abordat subiectul soluţiilor de scanare online, voalat m-am înscris în această categorie, doar că acum punem lucrurile în ordine.
Plus că vor urma câteva articole dedicate soluţiilor „in the cloud” şi vreau ca ele să aibă să aibă parte de o vizibilitate sporită.
Însă norişorii se vor lăsa un pic aşteptaţi, dat fiind faptul că în această seară voi vorbi despre un instrument online de analiză a site-urilor web, dezvoltat la începutul acestui an, pe numele său WooRank.
Nu m-aş mira ca unii dintre voi să fi auzit deja de WooRank, cel puţin după reclama făcută de techcrunch.com la sfârşitul lunii ianuarie, când în urma traficului generat, au avut probleme serioase cu server-ul, însă scopul acestui articol nu este doar să vă „arunc” un link, ci să arăt în ce mod m-am folosit de WooRank, pentru a corecta anumite aspecte ale acestui blog.
Ce este WooRank ?
Un instrument online gratuit, destinat în special dezvoltatorilor online, ce oferă o serie de informaţii extrem de importante, privind comportamentul unui site. Momentan, proiectul se află în stadiul beta, analiza site-urile făcându-se în funcţie de 50 de criterii, însă odată cu introducerea versiunii premium (preconizată a avea loc în luna aprilie sau mai), numărul acestor indicatori va creşte la aproximativ 120. Ar mai fi de spus că în spatele proiectului se află un belgian (Jean Derély de la BetaGroup), unul dintre fondatorii agenţiei 1MD.be.
Cum acţionează WooRank ?
Spre deosebire de alte unelte asemănătoare, WooRank afişează rezultatele analizei în timp real, fără să impună restricţii utilizatorului (şi mă gândesc în special la restrângerea numărului de apelări într-un interval de timp dat), ori să ceară introducerea unor date confidenţiale.
Site-urile sunt analizate în funcţie de 50 de criterii (aşa cum spuneam şi câteva rânduri mai sus), împărţite în 6 secţiuni: numărul de vizitatori (eng. vizitors), conţinut (eng. content), optimizare on-site (eng. in-site SEO), optimizare off-site (eng. off-site SEO), experienţa oferită utilizatorului (eng. usability) şi informaţii despre site (eng. website informations). Pentru fiecare dintre cele 50 de criterii,WooRank returnează un indicator vizual, care poate fi verde (dacă la acel capitol, site-ul excelează), portocaliu (în cazul în care există ceva probleme), roşu (problemele sunt considerate importante) sau gri (dacă respectivul parametru nu influenţează nota finală).
În urma testelor făcute, am observat o variaţie a calificativului acordat, atât în funcţie de modificările interne (unde am optimizat o serie de elemente şi vă spun imediat care), cât şi a comportamentului online (pagini indexate de Google, backlink-uri, înscriere în DMOZ, ş.a.m.d.).
De ce şi cui este util WooRank ?
Cu toate că WooRank pare a se adresa specialiştilor în online, modul prietenos în care sunt prezentate informaţiile îl recomandă şi utilizatorului obişnuit, celui care încearcă să-şi administreze propriul site şi este mai degrabă preocupat să obţină o indexare CORECTĂ în motoarele de căutare. Dealtfel, cu toate că pe acest blog există o categorie dedicată SEO, am considerat că este mai eficient să vă îndrept paşii spre site-uri specializate (de genul http://www.webcopywriter.ro/) şi nu regreat decizia luată, eu însumi având încă foarte multe de învăţat.
Astă nu înseamnă cu nu pot să prezint o serie de unelte SEO (cum este şi cazul WooRank), a căror utilizare eficientă o putem învăţa împreună. A scrie pe blog, ori a administra acel blog sunt două lucruri diferite şi cred că fiecare dintre noi, avem nevoie de ajutor. Nu mi se pare o impietate să apelez la oameni mai bine pregătiţi într-un anumit domeniu şi cred că mitul administratorului omnipotent a făcut destul rău. Iar ca să închid paranteza, vă mai spun doar că nu consider un articol despre SEO ca fiind o „trădare” a nişei, câtă vreme utilizatorii fideli ai acestui blog (sau cel puţin o parte dintre ei) şi-am manifestat interesul pentru acest gen de materiale.
Un test cu WooRank şi interpretarea rezultatelor
Pentru test am ales, aşa cum era şi normal, blogul Stefa Media şi vom discuta un pic pe marginea rezultatelor obţinute.
URL: http://www.woorank.com/en/www/stefamedia.ro
Vizitatori
Traficul, între 30.000 şi 100.000 de vizitatori, este corect estimat. Nu influenţează însă nota finală.
În ierarhia Alexa, poziţia este 375.802. Portocaliu.
Conţinut
Numărul paginilor indexate de Google este mai mic decât totalul trimis prin sitemap.xml. Portocaliu
Cele mai populare pagini sunt cele corespunzătoare categoriilor WORDPRESS, INFORMAŢII, DESPRE NOI sau SOFTWARE. Nu influenţează nota finală.
Optimizare on-site
Analiza paginii de start
Dacă în privinţa URL-ului, WooRank nu are nimic de obiectat, am fost surprins să observ că titlul „Stefa Media » Blog adresat utilizatorului obişnuit, pasionat de IT” este văzut ca fiind de 73 de caractere, cu toate că el nu are decât 67. Nu ştiu de ce este returnat codul » şi nu caracterul implicit, însă atâta vreme cât Google nu are o problemă cu acest lucru, avertizarea portocalie făcută de WooRank pare exagerată.
Descrierea, cuvintele cheie şi titlurile h1, h2, h3, ş.a.m.d. sunt considerate a fi în regulă. Verde. Paradoxal, nici dacă se folosesc mai multe titluri h1 în aceeaşi pagină (acţiunea nerecomandată de Google), WooRank nu pare deranjat şi afişează cu nonşalanţă bulina verde.
Imaginile, în marea lor majoritate (13/18), au atributul „alt” completat. Verde.
Raportul Text / HTML, şi vă explic imediat în ce constă, este de 17.48%. Verde. Este important, conform WooRank, ca informaţiile dintr-o pagină, textul, să contorizeze măcar 15% din totalul liniilor de cod.
Nu folosesc frame-uri şi nici flash. Verde.
Analiza conţinutului
Folosesc titluri unice pentru fiecare pagină. Verde.
Respectarea standardelor
Adresa stefamedia.ro, cu sau fără www returnează acelaşi rezultat. Verde.
Au fost identificate cu succes fişierele robots.txt, sitemap.xml şisitemap.xml.gz. Verde.
Limba. Teoretic nedeclarată şi detectată .ro. Cod roşu, dar e o greşeală din partea WooRank. Documentul nostru este XHTML 1.1 (strict), iar una din modificările aduse faţă de versiunea 1.0, este renunţarea la atributul lang în favoarea lui xml:lang. NU-mi este permis să folosesc xml:lang=ro lang=ro, cu doar xml:lang=ro, ceea ce am şi făcut !
Dealtfel, câteva rânduri mai jos, este identificat corect tipul documentului XHTML 1.1 şi primesc verde pentru validarea W3C. Codarea UTF-8, folosirea Google Analytics şi a micro formatelor (xfn, rel-nofollow, rel-tag) aduc alte aprecieri pozitive. Verde.
Roşu în schimb, pentru lipsa elementele Dublin Core şi Geo Meta Tags. Google nu ţine cont de meta tag-urile geografice, orientându-se după extensia domeniului, IP, GTLD (Generic Top Level Domain ) şi CcTLD (Country code Top Level Domain) şi doar Bing ar pune ceva bază pe aceste informaţii. E o greşeală că nu le-am trecut în pagină ? Nu, doar voi încerca să completez respectivele tag-uri.
Optimizare off-site
Aici, fie că vorbim de popularitate, înscrierea în directoare web sau prezenţa în social-media, situaţia se prezintă destul de rău, un lucru firesc, în condiţiile în care nu am făcut nici un fel de optimizare off-site.
Inclusiv numărul de backlink-uri este destul de mic, însă şi aici există o explicaţie (nu spun că-i înţeleg logica): reticenţa celor mai mulţi dintre noi în a preciza sursele, sau de a face trimiteri spre site-uri româneşti, fie ele chiar incluse în blogroll.
Le mulţumesc pe această cale lui Andrei (http://www.worldit.info/), Ionuţ (http://blog.weebo.ro/), George (http://yo9fah.net/), Marius şi tuturor celorlalţi care nu s-au sfiit să citeze blogul Stefa Media.
Doar un privinţa fluxului RSS, primesc o bulină verde.
Dintre problemele semnalate şi pe care voi încerca să le remediez, doar înscrierea în DMOZ merită ceva atenţie. Rămâne de văzut. Ştiu că procedura este una destul de alambicată, iar un răspuns privind acceptarea sau neacceptarea, poate veni şi după câţiva ani.
Experienţa oferită utilizatorului
E dificil de tradus în limba română, usability, mai ales atunci când se discută despre „readability level”, interpretat ca şi nivelul de cunoştinţe de care are nevoie un utilizator pentru a înţelege articolul. WooRank mă taxează cu o bilă roşie şi-mi recomandă un articol de pe smashingmagazine.com. Multe din sfaturile prezentate acolo, le-am urmat deja şi am motive să suspectez Woorank că face exces de zel… din nou.
Bine că pictograma favorită (favicon.ico) mai spală din ruşine, aducând un plus de verde.
Informaţiile despre server
Orice site al cărui timp de încărcare (mă refer evident la pagina testată) depăşeşte 2 secunde, este automat trimis în zona roşie. Idem şi pentru site-urile care nu folosesc gzip.
Bulină verde pentru navigarea în siguranţă, logic în condiţiile în care am insistat destul de mult asupra acestui aspect .
Server-ul din Bucureşti, IP-ul, site-urile considerate a fi din aceeaşi categorie sau informaţiile despre domeniu nu influenţează nota finală de 55.3, în condiţiile în care media s-ar situa în jurul valorii de 47.5 !
În loc de încheiere…
Vreau să spun două cuvinte, nu strict legat de Woorank, ci în legătură cu transformările care au survenit pe acest blog în ultimul timp. Poate doar cititorii fideli să fi observat că am încercat în permanenţă să îmbunătăţesc timpul de încărcare al paginilor, aranjarea informaţiilor sau modul de prezentare, totul pentru a oferi vizitatorului o experienţă cât mai plăcută. Vă dau un exemplu. În urmă cu două 2-3 săptămâni, prima pagină din blog avea ~ 600 Kb, pentru ca acum să descărcaţi doar 372Kb.
Am optimizat pozele (în special PNG-urile), am introdus expirarea cache-ului (şi îi mulţumesc încă o dată lui Sergiu http://www.lamp.ro/ pentru ajutor), am ordonat corespunzător CSS-urile şi JS-urile, iar pe listă se află implementarea gzip şi folosirea unui domeniu special pentru descărcarea resurselor statice. Am muncit mult pentru ca acest blog să fie ajungă la un nivel acceptabil, ştiu că mai am „de tras”, însă este extrem de important şi feedback-ul, reacţia voastră.
Ca să închei totuşi cu ceva legat de Woorank, nu uitaţi că puteţi urmări evoluţia acestui proiect interesant, pe blogul dedicat sau pe Twitter. V-am salutat cu respect.
Materiale bibliografice:
- http://www.alexa.com/
- http://blog.woorank.com/meet-woorank
- http://twitter.com/woorank
- http://techcrunch.com/2010/01/24/woorank/
- http://www.w3.org/TR/xhtml11/changes.html




Ai spus că ai de gând să folosești un CDN sau ceva asemănător. Hmm, nu știu, în afară de SimpleCDN mi se pare destul de scumpă soluția asta și nu prea îi văd utilitatea practică dacă nu ai mai mult de 1000 de vizitatori pe zi.
Salut Eugen
Aş putea spune despre tot acest blog că nu are altă utilitate, în afara faptului că îmi place să învăţ lucruri noi. După ce am instalat PageSpeed am luat acele opţiuni „la rând” şi sunt curios cât de bine pot să-l fac să meargă.
Ai dreptate în ce priveşte CDN-ul. Să nu uităm că aceste proiect nu se autofinanţează (n-am adsense, bannere sau alte afilieri), iar costurile trebuie menţinute într-o limită rezonabilă. Alternativa unui „cookieless domain” pare ceva mai uşor de abordat.
Salut Andrei. Blogul este o reușită,am mai spus-o. Amintești de faptul ca mai ai multe de învățat,noi cititorii acestui blog,vom învăța împreună cu tine,indiferent ca suntem mai novici sau mai avansați,asta nu contează. In ceea ce privește articolul,mărturisesc ca nu am știut de Woorank,citind articolul tău am aflat mai multe aspecte care nu le știam. Ma bucur sa învăț lucruri noi și utile,din fiecare articol postat aici.Mulțumesc! STIMA.
referitor la limba, nu uita ca ai la dispozitie:
http-equiv=”content-language” content=”ro”
si
name=”language” content=”ro”
cat despre trafic, empiric am observat ca influenteaza intr-o masura foarte mare rankul final.
Salut. N-am încercat să adaug CONTENT=”RO”, folosind doar xml:lang=ro lang=ro, însă schimbarea de la html strict 1.0 la 1.1, m-a lăsat un pic descoperit. Mersi frumos fiindcă mi-ai reamintit. Singur, mai sunt câteva lucruri de făcut (geo tag-urile, gzip, înscrierea în dmoz)… poate un server rapid.
Cât priveşte traficul, aici sunt „descoperit” fiindcă nu m-a preocupat, fiind mai degrabă interesat să obţin un feedback din partea cititorilor existenţi.
Pare destul de interesant woorank asta. Genereaza frumos un raport bine structurat care prezinta destul de clar situatia site-ului la momentul respectiv.
Salut Daniel
Şi bine ai venit de blogul Stefa Media. Cum lucrezi în domeniu, Woorank nu poate să-ţi ofere mari surprize, însă într-adevăr, informaţiile sunt prezentate într-un mod plăcut, accesibil inclusiv acelora care se confruntă pentru prima dată cu o astfel de aplicaţie. Aştept cu nerăbdare soluţia comercială şi să mai remedieze o serie din bug-uri.