Como criar um bom XML Sitemap

A nova versão do And After teve algumas mudanças bastante significativas de front-end e back-end, e isso causou uma gigantesca penalização na indexação do Google – deixamos de utilizar o subdomínio www e viramos um domínio no-www classe B (que redireciona tudo que tenha www retirando o subdomínio).

Seria possível manter o subdomínio www funcionando para evitar isso, mas resolvemos assumir o risco pois acreditamos que atualmente não faz sentido seu uso e também evita a possibilidade do conteúdo ser considerado duplicado nos domínios andafter.org e andafter.org.

Se você quer aprender um pouco mais sobre Search Engine Optimization (SEO) recomendo algumas leituras:

Sitemap protocol

Padronização é a palavra que faz a web funcionar de forma organizada e bonita, existem recomendação para criação de sitemaps em XML que são usada por vários motores de busca, incluindo o Google (que sempre foi o buscador que mais trouxe resultados para o And After).

Você pode encontrar a documentação completa e mais informações no sitemaps.org

 

Exemplo de sitemap

Segue um exemplo de sitemap com as especificações do sitemap protocol 0.9:

 

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>http://www.example.com/</loc>
      <lastmod>2005-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   </url>
</urlset>

 

Cada link para o seu site deve ser um tag seguindo a estrutura acima, e as tags filhas são:

  • loc (obrigatório) – a url completa da página, incluindo o protocolo (http:// por exemplo)
  • lastmod (opcional) – a data da última modificação da página, seguindo a formatação do
    W3C Datetime  (exemplod: YYYY-MM-DD)
  • changefreq (opcional) – frequência de atualização da página, pode ter os seguintes valores:

    • always
    • hourly
    • daily
    • weekly
    • monthly
    • yearly
    • never
  • priority  (opcional) – define a importância relativa entre as páginas do seu site, o valor vai de 0.0 a 1.0.

 

Dicas: um sitemap não deve ter mais do que 50.000 links, se for necessário você pode criar mais de um sitemap e criar um índice de sitemaps (leia mais em inglês).

Depois de feito você pode cadastrar seu sitemap no Google Webmaster Tools e isso vai evitar que alguma de suas páginas não seja encontrada pelo Google e com a seleção de prioridade interna (priority) você pode escolher quais urls devem ter preferência sobre as outras do seu domínio no posicionamento das buscas (lembrando que isto não influencia o posicionamento na busca quando comparado com outros domínios, apenas define uma url preferencial quando páginas do seu domínio estão "concorrendo" por uma posição).

Plugin para meta-tags – WordPress

Como vocês já devem ter percebido, tenho feito alguns posts aqui no O Desenvolvedor sobre o WordPress. Tenho usado ele em algumas soluções para trabalhos freelas onde consigo adaptá-lo para ser um CMS de rápida instalação, fácil manutenção e barata hospedagem e disponibilidade e é relativamente flexível.

Uma das coisas que eu senti falta em todos os temas que baixei, era a presença das meta-tags description e keywords. Achei estranho, mas entendi o porque: os elementos básicos de postagem do WP, post e page, não possuem esses campos. Fiquei pensando em como fazer um workaround – ou como um colega do trabalho fala, um contorno técnico.
Mas, uma coisa que eu aprendi depois de deixar a progração desktop em C e partir para web, é que reinventar a roda toda vez não é preciso. E, logicamente, deveria haver algum plugin para isso.

Voi-lá. Eis que achei o Another WordPress Meta Plugin.

Estou usando ele em dois projetos pessoais: meu site próprio e no Eu Comi! (esse surgiu numa idéia/bate-papo com o @gserrano). Já notei uma certa diferença na indexação das páginas e afins.
*quer saber mais sobre a importância das meta-tags? No And After há uma série de posts a respeito:

Voltando ao plugin, ele segue o padrão de instalação de todos outros do WP: faça download, descompacte na pasta plugins, ative pela interface de admin e faça uma alteração no arquivo de cabeçalho do seu tema. Tudo bem explicadinho no how-to do site do projeto.
Tendo isso sendo feito, toda vez que você criar um post ou page, verá dois campos logo abaixo do editor de conteúdo: um chamado keywords, e o outro description. Sem segredos!
 

SEO: siga o bom-senso, e não as fórmulas prontas

SEO é sem sombra de dúvidas um dos assuntos mais recorrentes nos blogs hoje em dia. Ter um site bem colocado nos mecanismos de busca faz com que a viabilidade de qualquer projeto esteja bem encaminhada.

Sou muito contra a maioria dos posts que vejo por aí, e também muito contra um monte de empresas que ganham em cima de SEO: já vi muita coisa que é puro achismo. Como, por exemplo, regras que são ditas, como:

  • o título da sua página deve ter de 3 a 5 palavras
  • a meta-tag description deve ter até 160 palavras
  • você deve usar entre 5 a 10 palavras-chaves na meta-tag keywords

A última regrinha dessas, que vi, é a seguinte para calcular o peso de uma palavra-chave:

  • x: quantidade de palavras da palavra-chave
  • y: quantidade de vezes que este palavra-chave tem dentro da descrição
  • z: quantidade de palavras da descrição
  • Peso= x*y/z*100%

Tendo calculado o peso, estima-se que ele deve ser maior do que 4%.

Agora… de onde vem isso? De onde alguém tirou essa regra? Já vi empresas cobrando fortunas, do tipo R$30 mil, para fazer a avaliação de um projeto de médio porte, usando um monte dessas regras inventadas por não-sei-quem.

 

Eu ainda sou um defensor do bom-senso; SEO está ligado a coisas como, por exemplo:

  • uso correto da semântica do html (conteúdo no html, layout no CSS)
  • webwritting bem feito (textos sucintos, que vão direto ao ponto)
  • escolha correta das keywords (poucas, mas bem escolhidas), tentando pegar as que aparecem na description, título da página e conteúdo (só isso já dá um peso grande para cada keyword)

Quero ler o livro que o Google lançou sobre SEO; mas eu dúvido que lá eles dêem o how-to de como são calculados os fatores do Page Rank e afins. Aposto que devem falar muito mais sobre conceitos, bom-senso e boas práticas na construção do seu website do que dar formulateas prontas para calcular índices na sua página.

Sugiro uma lida nesse texto sobre SEO e como o Google posiciona os resultados de busca; nada de regrinhas, formulinhas prontas. O bom-senso e a boa construção de um projeto, mais a utilização de técnicas não-invasivas – ou blackhat SEO – são a chave.

SEO e como o Google posiciona seus resultados de busca

SEO é o conjunto de estratégias com o objetivo de potencializar e melhorar o posicionamento de um site nas páginas de resultados naturais nos sites de busca, segundo definição da Wikipedia.



Quando um robo de busca faz o seu trabalho, os principais levados em conta são:

– escrita semântica do código html entregue a eles, conhecido como Web standard

– uso das metatags description e keywords, aplicando conteúdo significativo para as mesmas (obs.: o Google possui o serviço, https://adwords.google.com/select/KeywordToolExternal, que analisa o conteúdo da página e sugere keywords, e o http://www.google.com/trends, onde pode-se pesquisar o histórico de busca de qualquer palavra-chave ou termo, fazendo um comparativo)

– evitar ao máximo referências inexistentes, ou link quebrados

– atualização constante do conteúdo

– termos relevantes no conteúdo da página (usar no conteúdo termos que os buscadores associam como sendo relacionados ao tema principal da página)





Google

O mais famoso sistema de buscas de site, o Google, se utiliza além desses fatores previamente citados, do conceito de Page Rank para posicionar um determinado site nos resultados das suas buscas. O Page Rank é um cálculo complexo que o Google (definidora do conceito de Page rank) não expõe, mas que se sabe que é calculado a partir da quantidade de referências (links) existentes em outras páginas e dos seus respectivos Page Ranks. Ou seja, quanto mais referências em páginas com bons Page Ranks o site tiver, melhor será o seu Page Rank, como se fosse uma espécie de votação.





Estratégias para aumentar referências ao site:

  • disponibilização de feeds (RSS): com isso, qualquer pessoa que visita o Portal CI pode assinar o feed e receber automaticamente no seu leitor de feeds as últimas notícias (ter em mente que a atualização deve ser constante, caso contrário o usuário perderá interesse em assinar o feed)
  • marketing viral: uso de redes sociais (Orkut, Facebook, Twitter, ) blogs e/ou outros serviços (Youtube) para disseminar a informação disponibilizada em um site ou ou um serviço (e consequentemente disseminam-se referências). Com isso, escolhem-se pontos estratégicos para divulgar uma determinada informação e esses próprios meios (os usuários) começam a disseminar essa informação, passando-a para frente (daí vem o uso do termo vírus, fazendo alusão de que a informação se auto-dissemina, semelhante a uma epidemia)
  • parcerias com demais sites da mesma área: contribuir com a publicação de conteúdo em outros sites e aceitar publicações dos outros sites (com isso, tem-se troca de referências entre sites que tratam de assuntos similares, agregando valor ao Page Rank)
  • facicitar a inclusão das páginas em redes sociais: possibilitar ao usuário, através de links de fácil acesso, incluir um conteúdo específico em serviços como del.icio.us, Digg, Technoratti, etc…
  • ações através de e-mail marketing direcionado a um público-alvo (que deve ser definido qual é após um estudo dizendo qual o perfil que a campanha deve atingir), hotsites, exposições pagas em outros sites, estimulando o acesso dos usuários e fomentando o marketing viral
  • disponibilização de widgets: uma nova tendência na web é a possibilidade dos usuários adicionar, a uma rede social (Orkut, Open Social, Facebook, etc…) ou start-page (hNetvibes, iGoogle) que ele participa, um determinado serviço de um site ou de outra rede social. Por exemplo, a American Airlines disponibilizou um widget, disponível para o Open Social (e em breve Orkut) com o qual o usuário pode fazer buscas de passagens aéres (http://www.google.com/ig/directory?url=www.labpixies.com/gadgads/aa/aa_ie_link_site.xml).



Google Adwords

É o serviço do Google onde palavras-chave são vendidas e, quando uma busca é efetuada se utilizando de uma dessas palavras-chave, um anúncio ( com conteúdo definido pelo cliente) é exibido na página de resultado. Usar a combinação do Google Trends (que analisa quais as palavras mais procuradas), Google Keyword Tool (que sugere palavras-chave) e o Google Analytics (serviço de análise do comportamento dos usuários que chegaram ao seu site) são importantes para definir o ponto de partida da campanha, ou seja, definir quais as palavras-chave que devem ser compradas e o formato do anúncio, bem como devem ser utilizadas no decorrer da campanha para efetuar qualquer alteração necessária.

 

Existem vários sites e blogs especializados no assunto. Indico uma boa pesquisa (nos sites buscadores! hehe) para ler mais a fundo a respeito 😉

SEO – O Google ignora as metatags

Estou participando do projeto de um portal para uma empresa multinacional e conversando sobre sites full flash com o responsável de TI da empresa entrou o assunto meta tags para indexação.

Será que as metas são realmente importante para a indexação?
Não. Pelo menos para o Google a resposta é não.

O Google geralmente ignora a metatag que muitos desenvolvedores consideram muito importante: keywords. Provavelmente isso é feito pela facilidade de "burlar" isso e encher de palavras-chaves que pouco (ou nada) tem a ver com o conteúdo. Spam nas keywords é técnica conhecida desde sempre pelos mal intencionados…

Peguei a informação no Blog Oficial do Google Web Masters, segue o diálogo dos comentários:

Glen at Webstart said…

Hi John,
I notice that you do not mention the keywords meta tag – does this mean that Google totally ignores it?

John Mueller said…

Thanks for asking, Glen! You”re right in that we generally ignore the contents of the "keywords" meta tag. As with other possible meta tags, feel free to place it on your pages if you can use it for other purposes – it won”t count against you.

Official Google Webmasters Central Blog

Para não ficar dúvida, John Mueller escreve no blog oficial, ou seja, a resposta deve ser verdadeira.

Recomendo esta breve introdução a meta tags , feita no Tableless, que não fala muito do assunto mas dá uma idéia do que deveriam fazer algumas metatags.

Nem de longe as meta tags são tão importantes para a indexação como outros elementos, mas quais são estes elementos?

Apresentei a algum tempo um estudo de SEO bem aplicado, mesmo depois do resultado apresentado (aumento de 180% na visitação vinda dos buscadores) continuei testando e aplicando outras técnicas, principalmente de tageamento no html.

A tag TITLE (título da página) e as palavras usadas em outros sites para linkar para a sua página (Google bombing é a prova de que isso funciona) realmente fazem seu site subir e descer em uma busca.

Não posso dizer ao certo sobre o título e as tags h1, h2, etc. Uso o título e a h1 com as mesmas palavras – e os links de outros sites também, e com busca por estas palavras o And After normalmente aparece na primeira página. 

O primeiro passo continua sendo limpar o html para facilitar os outros passos de uma boa otimização.

Para quem quer resultados rápidos é usar palavras chaves no título da frase – testei aqui no And After e o resultado foi muito bom. O Bruno Alves escreveu sobre o peso do título para a otimização e ainda deu algumas dicas de como escrever um bom título, recomendo a leitura.