❌ 未被索引的原因
- 被 "NOINDEX "标记排除。
- 该页面
<标题
于meta name="robots" content="noindex">
谷歌不会索引它,因为它包含相同的标签。- 解决方案: 删除 noindex 标签并重新提交。
- 没有用户选择标准的重复页面
- 多个 URL 上存在相同或相似的内容、
rel="canonical"
标签丢失或设置错误。- 解决方法:将 canonical 设置为 canonical URL → 修复重复页面,使其指向 canonical URL。
- 未找到 (404)
- 谷歌无法索引它,因为该 URL 并不存在。
- 解决方法:如果页面实际上不存在,则忽略它,如果应该存在,则正常恢复它。
- 已抓取 - 目前未编入索引
- Google 已访问过该页面,但尚未将其编入索引(原因多种多样,包括质量、重复、缺乏内部链接等)。
- 解决方法:提高内容质量,获取内部/外部链接,提交网站地图,然后等待。
✅ 如何确保做好索引?
无索引
如果页面不需要,请删除。- 使用规范标签指定规范 URL。
- 如果不需要 404 页面,就不要去管它,如果需要,就修复它。
- "已抓取 - 当前未编入索引 "可能需要一些时间,因此请使用 注册网站地图 + 加强内部链接 建议
答:NOINDEX 标记将其排除在外。解决
1️⃣什么是 NOINDEX 标记?
网页 <标题
区域包含以下代码:
<meta name="robots" content="noindex, follow">
无索引
→ 搜索引擎 索引此页面(将其列入搜索结果) 不要做的指示遵循
→ 您可以跟踪页面内的链接
换句话说,页面本身被阻止出现在谷歌搜索中。
2️⃣为什么里面有一个 NOINDEX?
- 在开发/测试环境中被暂时封锁
(例如暂存网站、临时网页) - 如果您的内容管理系统(如 WordPress/Labels)通过设置阻止了它
- WordPress → 管理
设置 > 阅读 > 请求搜索引擎不索引本网站
检查 - 在 RankMath、Yoast 等搜索引擎优化插件中取消特定帖子/页面的索引。
- WordPress → 管理
- 当您想故意阻止搜索可见性时
(登录页面、内部专用页面、隐私相关页面等)。
3️⃣解决方法
👉如果绝对需要索引(曝光),请按以下步骤操作:
(1) 直接修改 HTML
<!!! -- 修复后
(2) 如果您使用的是 WordPress
- 取消对整个网站的索引
- 管理员 → 管理员 设置 > 阅读 → Β
要求搜索引擎不收录本网站
取消选中
- 管理员 → 管理员 设置 > 阅读 → Β
- 取消对单个帖子/页面的索引
- RankMath、Yoast 等 SEO 插件将进入并创建一个
索引
打开选项
- RankMath、Yoast 等 SEO 插件将进入并创建一个
(3) 对于 Laravel 或自制网站,使用
resources/views/layout.blade.php
确保您的元标记采用相同的基本布局无索引
→ Β索引
或完全删除
4️⃣修改后的核查程序
- 编辑代码/设置 → 保存网站
- 谷歌搜索控制台在
- 检查 URL → 点击 "请求索引
- 查看几天后搜索引擎中是否有所反映 (
站点:域名地址
搜索)
B. 解决没有用户选择标准的重复页面问题
1️⃣含义
- 在谷歌看来 内容几乎相同的多个页面到、
您不知道其中哪个 URL 应作为 "代表性(规范化)页面 "编入索引。
例如
https://wi-th.com/page/123
https://www.
wi-th
.com/page/123https://
wi-th
.com/page/123?utm_source=kakao
→ 内容相同,但地址不同。
→ 谷歌感到困惑:"哪一个是官方地址?
2️⃣为什么会这样?
- 域/协议重复
http://
vshttps://
www.
vs非www
- URL 参数问题
?utm_source=...
,?replytocom=...
,sessionid=...
带衬垫的页面
- 重复的类别/标签/档案页面
- 也可以使用
类别页
,标签页
,职位本身
暴露给所有人
- 也可以使用
- 分页/排序选项
/shop?page=2
,/shop?sort=price
如果内容相同,但 URL 不同,例如
3️⃣解决方法
关键是 精选页面(完整 URL) 来指定!
(1) rel="canonical"
使用标签
将代表 URL 设置为 <标题
在
- 谷歌将带规范化的 URL 识别为 "官方 "URL → 只有这些 URL 才会被索引
- 将其余内容视为重复内容,并将其从索引中排除
(2) 已在 WordPress 中解决
- 搜索引擎优化插件(Yoast、RankMath) 自动支持
- 直接在每个帖子/页面上编辑规范 URL
- 大多数情况下,正文 URL 会自动设置为规范 URL
- 阻止重复页面
- 用于不需要的存档页面,如标签存档、日期存档等。 无索引 加工
- RankMath →
搜索引擎优化设置 > 存档
通过
(3) 服务器设置(选择)
- 处理域名重复
http → https
301 重定向www → 非 www
或者相反,统一
示例(nginx):
服务器 {
server_name www.wi-th.com;
return 301 https://wi-th.com$request_uri;
}
如何檢查 4️⃣
- 修改后 搜索控制台 → 检查 URL → 请求索引
site:wi-th.com 发表标题
搜索 → 如果只出现规范 URL 而不是重复 URL,则正常
C. 解决找不到的问题 (404)
1️⃣含义
- 当 Google 检测到网站地图、内部链接或外部链接到 我找到了一个 URL,但在请求地址时,却得到了 404(未找到)的回复收到。
- 换句话说 页面不存在服务器告诉我
2️⃣为什么会发生?
- 删除的帖子/页面
- 如果您删除了之前发布的帖子或 URL 已更改
- URL 错误/无效链接
- 内部链接或外部网站的地址不正确。
- 更改 WordPress 标头
- 例如邮政地址
/hello-world
→ Β/welcome
现有地址将是 404
- 例如邮政地址
- 更改类别/标记结构
/category/abc/post-name
→ Β/abc/post-name
现有地址将消失
- 网站地图不正确
- 如果您的 sitemap.xml 包含尚未存在(已删除)的 URL
3️⃣解决方法
👉具体情况具体分析。
(1) 该页面是 如果您真的需要
- 恢复帖子/页面
- 或创建一个新职位,并与现有地址对齐(恢复标题)
(2) 如果 URL 已更改
- 设置 301 重定向
- 告诉 Google "旧地址已消失,新地址在这里"。
WordPress 插件示例:
- 重定向 插件 → 插件
/old-url
→ Β/new-url
制图
NGINX 示例
位置 /old-url {
return 301 https://in-te-ri-or.com/new-url;
}
(3) 如果您确实不需要该页面
- 404 保留原样即可 → 随着时间的推移,Google 会将其从索引中移除
- 然而 确保从网站地图中删除应该
4️⃣搜索控制台的处理流程
- 404 页面在 Search Console 中被报告为 "未编入索引"。
- 但并非所有 404 都是问题 ✅
- 运行博客时,删除旧文章自然会导致 404 → 正常
- 谷歌还能理解 "已删除网页",并逐步将其删除
5️⃣检查点
- 不必要的页面 → 保持 404(自然)
- 所需页数 → 301 重定向或恢复
- 网站地图 → 始终保持更新(无 404 URL)
D. 解决已抓取 - 目前未编入索引的问题
1️⃣含义
- Googlebot 页面已被访问(抓取),但未被索引(列入搜索结果)。 意味着还没有完成。
- 这是一条来自谷歌的信息,它说:"我们已经看到了你的页面,但我们认为它还不够重要,还不能将其包含在我们的搜索结果中"。
2️⃣为什么会这样?
出于多种原因,谷歌不会盲目索引每个抓取的页面:
- 内容质量不高
- 内容太短或冗余("薄内容)
- 确定重复内容
- 与其他页面内容几乎相同
- 缺乏内部链接
- 网站上的其他帖子/菜单没有链接到它,所以你认为它不重要
- 缺乏外部信誉
- 如果您的外部网站链接很少
- 创建新网站
- 如果您尚未获得信任,谷歌仅对您进行部分索引
- 技术问题
- 规范,机器人设置是扭曲的
- 响应太慢或不可靠 → Google 暂时搁置
3️⃣解决方法
您需要让 Google 相信 "此页面值得索引"。
(1) 提高内容质量
- 撰写至少 300 至 500 字的正文
- 独一无二(从其他帖子中脱颖而出)
- 添加图片、表格、视频等,丰富您的
(2) 加强内部联系
- 从另一个已被索引的职位链接到本职位
- 通过菜单/类别/标签进行访问
(3) 网站地图和搜索控制台
- 在网站地图.xml中包含该URL → 提交到搜索控制台
- 搜索控制台 > 检查 URL → 请求索引
(4) 赢得外部信誉
- 从社交媒体、博客和外部网站获取链接
- 外部链接很重要,尤其是当你的网站是新网站时
(5) 技术检查
- 确保规范标签正确
(如果您不小心指向了自己页面以外的其他页面,该页面将被取消索引) - 确保 robots.txt 和 meta robots 标签中没有阻止索引的元素
- 提高网站速度(通过 Lighthouse 和 PageSpeed Insights 进行测量)
4️⃣处理后的反射时间
- 索引请求并不总是立即发生,通常需要一段时间才能发生,通常是在 天至周 可能需要一段时间。
- 特别是 新网站谷歌可能需要更长的时间才能将其视为可信。
📌 Google 索引反射流
- 初始状态(无索引开启)
- 即使 Google 尝试抓取
<meta name="robots" content="noindex">
因为 不编制索引. - 因此记录为 "无法搜索"。
- 即使 Google 尝试抓取
- 稍后取消选中(无索引关闭→索引)
- 从那时起,谷歌在抓取时就会认为它是可索引的。
- 不过,"noindex "的历史已经存在,因此谷歌将不得不重新审视和更新,以改变索引。
- 索引时间
- 正常 天至周到几分钟。
- 原因:因为 Google 不会每天查看每个页面,而且重访频率因网站的重要性(域名授权、外部链接、网站地图提交)而异。
⏱️ 如何节省时间
这将促使 Google 快速抓取并再次索引:
- 在 Search Console 中检查 URL → 请求索引
- 直接提交的内容通常会在 1-3 天内被重新抓取。
- 注册网站地图
/sitemap.xml
提交 → 抓取程序会定期检查新帖子。
- 添加内部链接
- 如果您从另一个已被收录的帖子链接到新帖子,Google 会将其视为 "重要页面 "并加快访问速度。
- 外部资金流入
- 社交媒体、外部网站链接 → 作为 Googlebot 触发器。
Β 杂草