Razões para não ser indexado
- Excluído pela etiqueta "NOINDEX".
- Essa página
<cabeça
emmeta name="robots" content="noindex">
O Google não o indexará porque contém a mesma etiqueta.- Solução: Remover a etiqueta noindex e voltar a enviar.
- Páginas duplicadas sem um padrão selecionado pelo utilizador
- O mesmo conteúdo ou conteúdo semelhante existe em vários URLs,
rel="canónico"
A etiqueta está em falta ou incorretamente colocada.- Solução: Definir canónico para URL canónico → Corrigir páginas duplicadas para apontar para URL canónico.
- Não encontrado (404)
- O Google não o pode indexar porque esse URL não existe.
- Solução: Ignorar a página se ela não estiver realmente lá e recuperá-la normalmente se ela estiver.
- Rastreado - não indexado atualmente
- O Google visitou a página mas ainda não a indexou (por várias razões, incluindo qualidade, duplicação, falta de ligações internas, etc.)
- Solução: Melhorar a qualidade do conteúdo, obter ligações internas/externas, enviar o mapa do sítio e esperar.
Como é que me certifico de que estou a indexar bem?
noindex
Remover se não for uma página que o necessite.- Especificar um URL canónico com a etiqueta canónica.
- Deixe a página 404 em paz se não precisar dela, e repare-a se precisar.
- "Rastreado - não indexado atualmente" pode demorar algum tempo, por isso utilize a opção Registar o mapa do site + reforçar as ligações internas Recomendação.
A. É excluída pela etiqueta NOINDEX. Resolver
1️⃣ O que é a etiqueta NOINDEX?
Página Web <cabeça
contém o código abaixo:
<meta name="robots" content="noindex, follow">
noindex
→ Motor de busca Indexar esta página (listá-la nos resultados de pesquisa) Instruções a não fazerseguir
→ Pode seguir ligações dentro de uma página
Por outras palavras, a própria página é impedida de aparecer nas pesquisas do Google.
2️⃣ Porque é que há um NOINDEX aqui?
- Bloqueado temporariamente num ambiente de desenvolvimento/teste
(por exemplo, sítios de teste, páginas temporárias) - Se o seu CMS, como o WordPress/Labels, o tiver bloqueado com definições
- WordPress → Admin
Definições > Leitura > Pedir que os motores de busca não indexem este sítio
Verificar - Não indexar mensagens/páginas específicas em plug-ins de SEO como RankMath, Yoast, etc.
- WordPress → Admin
- Quando se pretende impedir deliberadamente a visibilidade da pesquisa
(páginas de início de sessão, páginas apenas internas, páginas relacionadas com a privacidade, etc.)
3️⃣ Solução alternativa
Se for absolutamente necessário indexar (expor), faça o seguinte
(1) Modificar diretamente o HTML
<!!-- após correção
(2) Se estiver a utilizar o WordPress
- Desindexar todo o sítio
- Administrador → Admin Definições > Leitura → Β
Solicitar que os motores de busca não indexem este sítio
Desmarcar
- Administrador → Admin Definições > Leitura → Β
- Desindexar posts/páginas individuais
- Os plug-ins de SEO, como o RankMath, Yoast, etc., irão criar um
Índices
Ativar opções
- Os plug-ins de SEO, como o RankMath, Yoast, etc., irão criar um
(3) Para Laravel ou sítios criados internamente, utilize a opção
resources/views/layout.blade.php
Certifique-se de que as suas meta tags têm o mesmo esquema básiconoindex
→ Βíndice
ou eliminá-lo completamente
4️⃣ procedimento de verificação após modificação
- Editar código/configurações → Guardar sítio
- Consola de pesquisa do Googlereinspeccionar esse URL em
- Inspecionar URL → Clicar em "Solicitar indexação"
- Verificar se se reflecte nos motores de busca após alguns dias (
site:Endereço de domínio
Pesquisa)
B. Resolver páginas duplicadas que não têm uma norma selecionada pelo utilizador
1️⃣ Significado
- Na opinião da Google, Várias páginas com conteúdo praticamente idênticopara,
Não sabe qual desses URLs deve ser indexado como uma "página representativa (canónica)".
Exemplo:
https://wi-th.com/page/123
https://www.
wi-th
.com/page/123https://
wi-th
.com/page/123?utm_source=kakao
→ O mesmo conteúdo, mas um endereço diferente.
→ O Google está confuso: "Qual destes é o endereço oficial?"
2️⃣ Porque é que isto está a acontecer?
- Duplicação de domínio/protocolo
http://
vshttps://
www.
vsnão www
- Problemas com parâmetros URL
?utm_source=...
,?replytocom=...
,?sessionid=...
Páginas com suporte
- Páginas de categoria/tag/arquivo duplicadas
- O mesmo posto também pode ser utilizado como um
Páginas de categoria
,Página de etiquetas
,O post em si
Exposto a todos
- O mesmo posto também pode ser utilizado como um
- Opções de paginação/ordenação
/shop?page=2
,/shop?sort=price
Se o conteúdo for o mesmo mas o URL for diferente, como por exemplo
3️⃣ Solução alternativa
A chave é Página em destaque (URL completo) para especificar!
(1) rel="canónico"
Utilizar etiquetas
Definir o URL do representante para <cabeça
no
- O Google reconhece os URLs com canónica como "oficiais" → apenas esses URLs são indexados
- Trate os restantes como duplicados e exclua-os do índice
(2) Resolvido em WordPress
- Plug-ins de SEO (Yoast, RankMath) Suporte automático
- Editar URLs canónicos diretamente em cada publicação/página
- A maioria define automaticamente o URL do corpo como canónico
- Bloquear páginas duplicadas
- Para páginas de arquivo de que não necessita, como arquivos de etiquetas, arquivos de datas, etc. noindex Processamento
- RankMath →
Definições de SEO > Arquivo
Facilmente possível com
(3) Definições do servidor (selecionar)
- Manuseamento de domínios duplicados
http → https
Redireccionamento 301www → não-wwww
Ou, pelo contrário, unificar
Exemplo (nginx):
servidor {
nome_do_servidor www.wi-th.com;
return 301 https://wi-th.com$request_uri;
}
Como consultar 4️⃣
- Após a modificação Search Console → Inspecionar URLs → Pedir indexação
site:wi-th.com Título do post
Pesquisa → Se apenas aparecerem URLs canónicos em vez de URLs duplicados, o normal
C. Resolução não encontrada (404)
1️⃣ Significado
- Quando o Google detecta que um mapa do site, uma hiperligação interna ou uma hiperligação externa para o Encontrei um URL, mas quando solicitei o endereço, recebi uma resposta 404 (Não encontrado)é recebido.
- Por outras palavras, A página não existee o servidor disse-me.
2️⃣ Porque é que isso acontece?
- Mensagens/páginas eliminadas
- Se tiver eliminado uma publicação anteriormente publicada ou se o URL tiver sido alterado
- Erros de digitação de URL/ligações inválidas
- Uma ligação interna ou um sítio externo tem um endereço incorreto.
- Alterar o slug do WordPress
- Exemplo: Endereço postal
/hello-world
→ Β/bem-vindo
o endereço existente será 404
- Exemplo: Endereço postal
- Alterar a estrutura de categorias/identificadores
/category/abc/post-name
→ Β/abc/nome-do-post
o endereço existente desaparecerá
- Mapa do site incorreto
- Se o seu sitemap.xml contiver URLs que ainda não existem (eliminados)
3️⃣ Solução alternativa
Depende muito do caso.
(1) a página é uma Se precisar mesmo de
- Restaurar um post/página
- Ou criar uma nova publicação e alinhá-la com o endereço existente (reverter o slug)
(2) Se o URL tiver sido alterado
- Configurar redireccionamentos 301
- Diz ao Google "o endereço antigo desapareceu, o novo endereço está aqui"
Exemplo de plugin WordPress:
- Redireccionamento Plugins → Plugins
/old-url
→ Β/new-url
Cartografia
Exemplo de NGINX:
localização /old-url {
return 301 https://in-te-ri-or.com/new-url;
}
(3) Se não precisar mesmo da página
- Não há problema em deixar o 404 como está → o Google irá removê-lo do índice com o tempo
- No entanto, Certifique-se de que remove dos mapas de sítiosDeve
4️⃣ Fluxo de processamento na Consola de Pesquisa
- As páginas 404 são reportadas como "não indexadas" no Search Console
- Mas nem todos os 404s são um problema ✅
- Quando se gere um blogue, a eliminação de mensagens antigas provoca naturalmente um erro 404 → Normal
- O Google também compreende as "páginas eliminadas" e remove-as gradualmente
5️⃣ Ponto de controlo
- Páginas desnecessárias → Manter 404 (natural)
- Páginas obrigatórias → 301 redirecionar ou restaurar
- Mapa do sítio → Sempre atualizado (sem URLs 404)
D. Resolve Crawled - Não indexado atualmente
1️⃣ Significado
- Googlebot A página foi visitada (rastreada), mas não indexada (listada nos resultados da pesquisa). significa que não foi efectuado.
- É uma mensagem do Google que diz: "Vimos a sua página, mas ainda não a consideramos suficientemente importante para a incluir nos nossos resultados de pesquisa".
2️⃣ Porque é que isto está a acontecer?
O Google não indexa todas as páginas rastreadas cegamente, por uma série de razões:
- Falta de qualidade do conteúdo
- O conteúdo é demasiado curto ou redundante ("Thin Content")
- Determinação de conteúdo duplicado
- Quase o mesmo conteúdo de outras páginas
- Falta de ligações internas
- Outras mensagens/menus do sítio não têm ligação a ele, pelo que decide que não é importante
- Falta de credibilidade externa
- Se tiver poucas ligações de sítios externos
- Novo sítio criado
- Se ainda não é de confiança e o Google só o indexa parcialmente
- Questões técnicas
- canónico, as definições dos robots são distorcidas
- Resposta demasiado lenta ou pouco fiável → O Google coloca-o em espera temporária
3️⃣ Solução alternativa
É necessário convencer o Google de que "vale a pena indexar esta página".
(1) Melhorar a qualidade dos conteúdos
- Escrever um corpo de, pelo menos, 300 a 500 palavras
- Ser único (distinguir-se de outras mensagens)
- Adicione imagens, tabelas, vídeos e muito mais para enriquecer o seu
(2) Reforçar as ligações internas
- Ligar a esta publicação a partir de outra publicação que já está indexada
- Tornar acessível através de menus/categorias/etiquetas
(3) Sitemaps e Consola de Pesquisa
- Incluir esse URL no seu sitemap.xml → Enviar para a Consola de Pesquisa
- Consola de pesquisa > Inspecionar URLs → Pedir indexação
(4) Ganhar credibilidade externa
- Impulsionar ligações a partir das redes sociais, blogues e sítios externos
- As ligações externas são importantes, especialmente se o seu sítio for novo
(5) Controlos técnicos
- Certifique-se de que a etiqueta canónica está correta
(Se apontar acidentalmente para uma página que não seja a sua, esta será desindexada) - Certifique-se de que não existem elementos de bloqueio de índice em robots.txt, meta tags de robots
- Melhorar a velocidade do sítio (medida pelo Lighthouse, PageSpeed Insights)
4️⃣ Tempo de reflexão após processamento
- Os pedidos de indexação nem sempre acontecem de imediato e, normalmente, demoram algum tempo a acontecer, geralmente por volta da altura do Dias a semanas Pode demorar algum tempo.
- Em particular, o Novos sítiospode demorar mais tempo a ser considerado fiável pelo Google.
Fluxo de reflexão da indexação do Google
- Estado inicial (noindex ON)
- Mesmo que o Google tente rastrear
<meta name="robots" content="noindex">
Porque Não se indexa a si próprio. - Por isso, foi registado como "não pesquisável".
- Mesmo que o Google tente rastrear
- Desmarcar mais tarde (noindex OFF → index)
- A partir daí, o Google considerá-lo-á indexável quando o rastrear.
- No entanto, já existe um histórico de "noindex", pelo que o Google terá de o revisitar e atualizar para alterar o índice.
- Tempo para indexar
- Normal Dias a semanasa alguns minutos.
- Porquê: Porque o Google não olha para todas as páginas todos os dias e a frequência das revisões varia consoante a importância do seu sítio (autoridade do domínio, ligações externas, submissão do mapa do sítio).
⏱️ Como poupar tempo
Isto encorajará o Google a rastrear e a indexar rapidamente:
- Inspecionar URLs na Consola de Pesquisa → Solicitar indexação
- Os envios diretos são frequentemente rastreados de novo no prazo de 1 a 3 dias.
- Registar um mapa do site
/sitemap.xml
Enviar → Os rastreadores verificam regularmente se há novas mensagens.
- Adicionar ligações internas
- Se ligar a uma nova publicação a partir de outra que já esteja indexada, o Google reconhecê-la-á como uma "página importante" e visitá-la-á mais rapidamente.
- Influxos externos
- Redes sociais, ligações a sítios externos → actuam como gatilhos para o Googlebot.
Β Erva