Porque é que as páginas da Consola de Pesquisa do Google não estão a ser indexadas?

Razões para não ser indexado

  1. Excluído pela etiqueta "NOINDEX".
    • Essa página <cabeça em meta name="robots" content="noindex"> O Google não o indexará porque contém a mesma etiqueta.
    • Solução: Remover a etiqueta noindex e voltar a enviar.
  2. Páginas duplicadas sem um padrão selecionado pelo utilizador
    • O mesmo conteúdo ou conteúdo semelhante existe em vários URLs, rel="canónico" A etiqueta está em falta ou incorretamente colocada.
    • Solução: Definir canónico para URL canónico → Corrigir páginas duplicadas para apontar para URL canónico.
  3. Não encontrado (404)
    • O Google não o pode indexar porque esse URL não existe.
    • Solução: Ignorar a página se ela não estiver realmente lá e recuperá-la normalmente se ela estiver.
  4. Rastreado - não indexado atualmente
    • O Google visitou a página mas ainda não a indexou (por várias razões, incluindo qualidade, duplicação, falta de ligações internas, etc.)
    • Solução: Melhorar a qualidade do conteúdo, obter ligações internas/externas, enviar o mapa do sítio e esperar.

Como é que me certifico de que estou a indexar bem?

  • noindexRemover se não for uma página que o necessite.
  • Especificar um URL canónico com a etiqueta canónica.
  • Deixe a página 404 em paz se não precisar dela, e repare-a se precisar.
  • "Rastreado - não indexado atualmente" pode demorar algum tempo, por isso utilize a opção Registar o mapa do site + reforçar as ligações internas Recomendação.

A. É excluída pela etiqueta NOINDEX. Resolver

1️⃣ O que é a etiqueta NOINDEX?

Página Web <cabeça contém o código abaixo:

<meta name="robots" content="noindex, follow">
  • noindex → Motor de busca Indexar esta página (listá-la nos resultados de pesquisa) Instruções a não fazer
  • seguir → Pode seguir ligações dentro de uma página

Por outras palavras, a própria página é impedida de aparecer nas pesquisas do Google.

2️⃣ Porque é que há um NOINDEX aqui?

  1. Bloqueado temporariamente num ambiente de desenvolvimento/teste
    (por exemplo, sítios de teste, páginas temporárias)
  2. Se o seu CMS, como o WordPress/Labels, o tiver bloqueado com definições
    • WordPress → Admin Definições > Leitura > Pedir que os motores de busca não indexem este sítio Verificar
    • Não indexar mensagens/páginas específicas em plug-ins de SEO como RankMath, Yoast, etc.
  3. Quando se pretende impedir deliberadamente a visibilidade da pesquisa
    (páginas de início de sessão, páginas apenas internas, páginas relacionadas com a privacidade, etc.)

3️⃣ Solução alternativa

Se for absolutamente necessário indexar (expor), faça o seguinte

(1) Modificar diretamente o HTML





  <!!-- após correção

(2) Se estiver a utilizar o WordPress

  • Desindexar todo o sítio
    • Administrador → Admin Definições > Leitura → Β Solicitar que os motores de busca não indexem este sítio Desmarcar
  • Desindexar posts/páginas individuais
    • Os plug-ins de SEO, como o RankMath, Yoast, etc., irão criar um Índices Ativar opções

(3) Para Laravel ou sítios criados internamente, utilize a opção

  • resources/views/layout.blade.php Certifique-se de que as suas meta tags têm o mesmo esquema básico
  • noindex → Β índiceou eliminá-lo completamente

4️⃣ procedimento de verificação após modificação

  1. Editar código/configurações → Guardar sítio
  2. Consola de pesquisa do Googlereinspeccionar esse URL em
    • Inspecionar URL → Clicar em "Solicitar indexação"
  3. Verificar se se reflecte nos motores de busca após alguns dias (site:Endereço de domínio Pesquisa)

B. Resolver páginas duplicadas que não têm uma norma selecionada pelo utilizador

1️⃣ Significado

  • Na opinião da Google, Várias páginas com conteúdo praticamente idênticopara,
    Não sabe qual desses URLs deve ser indexado como uma "página representativa (canónica)".

Exemplo:

  • https://wi-th.com/page/123
  • https://www.wi-th.com/page/123
  • https://wi-th.com/page/123?utm_source=kakao

→ O mesmo conteúdo, mas um endereço diferente.
→ O Google está confuso: "Qual destes é o endereço oficial?"

2️⃣ Porque é que isto está a acontecer?

  1. Duplicação de domínio/protocolo
    • http:// vs https://
    • www. vs não www
  2. Problemas com parâmetros URL
    • ?utm_source=..., ?replytocom=..., ?sessionid=... Páginas com suporte
  3. Páginas de categoria/tag/arquivo duplicadas
    • O mesmo posto também pode ser utilizado como um Páginas de categoria, Página de etiquetas, O post em siExposto a todos
  4. Opções de paginação/ordenação
    • /shop?page=2, /shop?sort=price Se o conteúdo for o mesmo mas o URL for diferente, como por exemplo

3️⃣ Solução alternativa

A chave é Página em destaque (URL completo) para especificar!

(1) rel="canónico" Utilizar etiquetas

Definir o URL do representante para <cabeçano


  • O Google reconhece os URLs com canónica como "oficiais" → apenas esses URLs são indexados
  • Trate os restantes como duplicados e exclua-os do índice

(2) Resolvido em WordPress

  • Plug-ins de SEO (Yoast, RankMath) Suporte automático
    • Editar URLs canónicos diretamente em cada publicação/página
    • A maioria define automaticamente o URL do corpo como canónico
  • Bloquear páginas duplicadas
    • Para páginas de arquivo de que não necessita, como arquivos de etiquetas, arquivos de datas, etc. noindex Processamento
    • RankMath → Definições de SEO > Arquivo Facilmente possível com

(3) Definições do servidor (selecionar)

  • Manuseamento de domínios duplicados
    • http → https Redireccionamento 301
    • www → não-wwww Ou, pelo contrário, unificar

Exemplo (nginx):

servidor {
    nome_do_servidor www.wi-th.com;
    return 301 https://wi-th.com$request_uri;
}

Como consultar 4️⃣

  1. Após a modificação Search Console → Inspecionar URLs → Pedir indexação
  2. site:wi-th.com Título do post Pesquisa → Se apenas aparecerem URLs canónicos em vez de URLs duplicados, o normal

C. Resolução não encontrada (404)

1️⃣ Significado

  • Quando o Google detecta que um mapa do site, uma hiperligação interna ou uma hiperligação externa para o Encontrei um URL, mas quando solicitei o endereço, recebi uma resposta 404 (Não encontrado)é recebido.
  • Por outras palavras, A página não existee o servidor disse-me.

2️⃣ Porque é que isso acontece?

  1. Mensagens/páginas eliminadas
    • Se tiver eliminado uma publicação anteriormente publicada ou se o URL tiver sido alterado
  2. Erros de digitação de URL/ligações inválidas
    • Uma ligação interna ou um sítio externo tem um endereço incorreto.
  3. Alterar o slug do WordPress
    • Exemplo: Endereço postal /hello-world → Β /bem-vindoo endereço existente será 404
  4. Alterar a estrutura de categorias/identificadores
    • /category/abc/post-name → Β /abc/nome-do-post o endereço existente desaparecerá
  5. Mapa do site incorreto
    • Se o seu sitemap.xml contiver URLs que ainda não existem (eliminados)

3️⃣ Solução alternativa

Depende muito do caso.

(1) a página é uma Se precisar mesmo de

  • Restaurar um post/página
  • Ou criar uma nova publicação e alinhá-la com o endereço existente (reverter o slug)

(2) Se o URL tiver sido alterado

  • Configurar redireccionamentos 301
    • Diz ao Google "o endereço antigo desapareceu, o novo endereço está aqui"

Exemplo de plugin WordPress:

  • Redireccionamento Plugins → Plugins /old-url → Β /new-url Cartografia

Exemplo de NGINX:

localização /old-url {
    return 301 https://in-te-ri-or.com/new-url;
}

(3) Se não precisar mesmo da página

  • Não há problema em deixar o 404 como está → o Google irá removê-lo do índice com o tempo
  • No entanto, Certifique-se de que remove dos mapas de sítiosDeve

4️⃣ Fluxo de processamento na Consola de Pesquisa

  • As páginas 404 são reportadas como "não indexadas" no Search Console
  • Mas nem todos os 404s são um problema ✅
    • Quando se gere um blogue, a eliminação de mensagens antigas provoca naturalmente um erro 404 → Normal
    • O Google também compreende as "páginas eliminadas" e remove-as gradualmente

5️⃣ Ponto de controlo

  • Páginas desnecessárias → Manter 404 (natural)
  • Páginas obrigatórias → 301 redirecionar ou restaurar
  • Mapa do sítio → Sempre atualizado (sem URLs 404)

D. Resolve Crawled - Não indexado atualmente

1️⃣ Significado

  • Googlebot A página foi visitada (rastreada), mas não indexada (listada nos resultados da pesquisa). significa que não foi efectuado.
  • É uma mensagem do Google que diz: "Vimos a sua página, mas ainda não a consideramos suficientemente importante para a incluir nos nossos resultados de pesquisa".

2️⃣ Porque é que isto está a acontecer?

O Google não indexa todas as páginas rastreadas cegamente, por uma série de razões:

  1. Falta de qualidade do conteúdo
    • O conteúdo é demasiado curto ou redundante ("Thin Content")
  2. Determinação de conteúdo duplicado
    • Quase o mesmo conteúdo de outras páginas
  3. Falta de ligações internas
    • Outras mensagens/menus do sítio não têm ligação a ele, pelo que decide que não é importante
  4. Falta de credibilidade externa
    • Se tiver poucas ligações de sítios externos
  5. Novo sítio criado
    • Se ainda não é de confiança e o Google só o indexa parcialmente
  6. Questões técnicas
    • canónico, as definições dos robots são distorcidas
    • Resposta demasiado lenta ou pouco fiável → O Google coloca-o em espera temporária

3️⃣ Solução alternativa

É necessário convencer o Google de que "vale a pena indexar esta página".

(1) Melhorar a qualidade dos conteúdos

  • Escrever um corpo de, pelo menos, 300 a 500 palavras
  • Ser único (distinguir-se de outras mensagens)
  • Adicione imagens, tabelas, vídeos e muito mais para enriquecer o seu

(2) Reforçar as ligações internas

  • Ligar a esta publicação a partir de outra publicação que já está indexada
  • Tornar acessível através de menus/categorias/etiquetas

(3) Sitemaps e Consola de Pesquisa

  • Incluir esse URL no seu sitemap.xml → Enviar para a Consola de Pesquisa
  • Consola de pesquisa > Inspecionar URLs → Pedir indexação

(4) Ganhar credibilidade externa

  • Impulsionar ligações a partir das redes sociais, blogues e sítios externos
  • As ligações externas são importantes, especialmente se o seu sítio for novo

(5) Controlos técnicos

  • Certifique-se de que a etiqueta canónica está correta
    (Se apontar acidentalmente para uma página que não seja a sua, esta será desindexada)
  • Certifique-se de que não existem elementos de bloqueio de índice em robots.txt, meta tags de robots
  • Melhorar a velocidade do sítio (medida pelo Lighthouse, PageSpeed Insights)

4️⃣ Tempo de reflexão após processamento

  • Os pedidos de indexação nem sempre acontecem de imediato e, normalmente, demoram algum tempo a acontecer, geralmente por volta da altura do Dias a semanas Pode demorar algum tempo.
  • Em particular, o Novos sítiospode demorar mais tempo a ser considerado fiável pelo Google.

Fluxo de reflexão da indexação do Google

  1. Estado inicial (noindex ON)
    • Mesmo que o Google tente rastrear <meta name="robots" content="noindex"> Porque Não se indexa a si próprio.
    • Por isso, foi registado como "não pesquisável".
  2. Desmarcar mais tarde (noindex OFF → index)
    • A partir daí, o Google considerá-lo-á indexável quando o rastrear.
    • No entanto, já existe um histórico de "noindex", pelo que o Google terá de o revisitar e atualizar para alterar o índice.
  3. Tempo para indexar
    • Normal Dias a semanasa alguns minutos.
    • Porquê: Porque o Google não olha para todas as páginas todos os dias e a frequência das revisões varia consoante a importância do seu sítio (autoridade do domínio, ligações externas, submissão do mapa do sítio).

⏱️ Como poupar tempo

Isto encorajará o Google a rastrear e a indexar rapidamente:

  1. Inspecionar URLs na Consola de Pesquisa → Solicitar indexação
    • Os envios diretos são frequentemente rastreados de novo no prazo de 1 a 3 dias.
  2. Registar um mapa do site
    • /sitemap.xml Enviar → Os rastreadores verificam regularmente se há novas mensagens.
  3. Adicionar ligações internas
    • Se ligar a uma nova publicação a partir de outra que já esteja indexada, o Google reconhecê-la-á como uma "página importante" e visitá-la-á mais rapidamente.
  4. Influxos externos
    • Redes sociais, ligações a sítios externos → actuam como gatilhos para o Googlebot.
Microsserviços ⓒ wi-th.com
Tudo o que é interior In-The-Rear.com
dknock.in-te-ri-or.com
Especialistas em interiores ⓒ dknock

Β Erva

Índice