📑 目录
酒店GEO自检清单:10分钟测出你的酒店能不能被AI搜到
GEO圈有个残酷真相:大部分酒店的网站,AI爬虫根本没来过。
不是你的内容不够好,是你的门根本没打开。
这份自检清单分三个级别——P0是致命缺陷(必须立刻修),P1是核心项(本周内修),P2是优化项(有条件就修)。每条都附带验证命令,复制到终端直接跑。最后给你一个评分卡,看看你的酒店GEO打几分。
准备:获取你的网站地址
把下面命令里的 你的域名 替换成你的实际域名:
# 先确认网站可达
curl -sI https://你的域名/ | head -1
# 期望输出: HTTP/2 200 或 HTTP/1.1 200 OK
🔴 P0 致命缺陷(缺一项=AI看不到你,立刻修)
P0-1:robots.txt 是否放行国内AI爬虫?
为什么致命: 豆包用的是 Bytespider,文心一言用的是 Baiduspider。你的 robots.txt 不放行这些爬虫 = 国内 AI 引擎根本抓不到你的网站。
# 检查 Bytespider(豆包/DeepSeek)是否放行 — 期望 >= 1
curl -s https://你的域名/robots.txt | grep -c 'Bytespider'
# 检查 Baiduspider(百度/文心一言)是否放行 — 期望 >= 1
curl -s https://你的域名/robots.txt | grep -c 'Baiduspider'
# 一键检查全部6个国内爬虫
curl -s https://你的域名/robots.txt | grep -E 'Bytespider|Baiduspider|YisouSpider|360Spider|Sogou|PetalBot'
☐ ✅ 通过:Bytespider 和 Baiduspider 都已放行
☐ ❌ 未通过:缺少任何一个 → 参考《酒店GEO完全指南》第一层的 robots.txt 模板
P0-2:robots.txt 是否返回纯文本(非HTML)?
为什么致命: 有些 nginx 配置会把所有路径 fallback 到 index.html,导致 robots.txt 返回 HTML 页面。AI 爬虫看到 HTML 而非纯文本规则,直接放弃抓取。
# robots.txt 第一行应该是 "User-agent",不是 "<!DOCTYPE" 或 "<html"
curl -s https://你的域名/robots.txt | head -1
☐ ✅ 通过:输出以 User-agent 开头
☐ ❌ 未通过:输出是 HTML → nginx 需要配置 location = /robots.txt 精确匹配返回文件
P0-3:网站是否有 JSON-LD 结构化数据?
为什么致命: AI 不是"看"你的网页,是靠 JSON-LD 结构化数据理解你是谁。没有 JSON-LD = AI 不知道你的网站是酒店。
# JSON-LD 块数量 — 期望 >= 2(至少 Organization + FAQPage)
curl -s https://你的域名/ | grep -c 'application/ld+json'
☐ ✅ 通过:>= 2 块 JSON-LD
☐ ❌ 未通过:< 2 块 → 需要添加 Organization + FAQPage 结构化数据
P0-4:sitemap.xml 是否存在且格式正确?
为什么致命: sitemap 是爬虫的"目录",告诉它网站有哪些页面。没有 sitemap = 爬虫只抓首页就可能走了。
# sitemap 必须是 XML
curl -s https://你的域名/sitemap.xml | head -1
☐ ✅ 通过:输出以 开头
☐ ❌ 未通过:返回 404 或 HTML → 需要生成 sitemap.xml
P0-5:H1 标签是否存在?
curl -s https://你的域名/ | grep -c '<h1'
☐ ✅ 通过:>= 1
☐ ❌ 未通过:= 0 → 添加包含核心关键词的 H1 标题
🟡 P1 核心项(本周内修,影响AI推荐权重)
P1-1:爬虫是否真的来过?
robots.txt 放行 ≠ 爬虫来过。这是实战中最大的认知差距。
# SSH 进服务器,查爬虫到访次数
ssh root@你的服务器 "
echo 'Bytespider:' \$(zgrep -c 'Bytespider' /var/log/nginx/access.log* 2>/dev/null)
echo 'Baiduspider:' \$(zgrep -c 'Baiduspider' /var/log/nginx/access.log* 2>/dev/null)
"
☐ ✅ 通过:Bytespider 和 Baiduspider 都有访问记录
☐ ❌ 未通过:均为 0 → 需要主动提交(百度站长平台 + 字节生态发文)
P1-2:FAQ 中有发现型问题吗?
发现型问题 = 搜服务的人能找到你。自解释型问题 = 只有搜你品牌的人能找到。
# 检查 FAQ 中是否包含发现型关键词
curl -s https://你的域名/ | grep -cE '哪家好|推荐|攻略|怎么选|怎么收费|适合'
☐ ✅ 通过:>= 3 个发现型关键词
☐ ❌ 未通过:< 3 个 → FAQ 需要重写,加入推荐/比较/攻略型问题
P1-3:酒店名称/地址/电话在所有平台是否一致?
豆包优先翻 POI 数据库(抖音/高德/大众),不是你的网站。名称差一个字 = AI 判定不同酒店。
☐ 抖音来客名称 = 网站名称 = 高德名称 = 百度名称 = 大众点评名称 = 携程名称
☐ 地址在所有平台一字不差(含"省/市/区/路/号")
☐ 电话在所有平台一致
P1-4:首页是否有配图?
# 图片数量
curl -s https://你的域名/ | grep -c '<img '
☐ ✅ 通过:>= 3 张
☐ ❌ 未通过:< 3 张 → 至少添加 3 张配图(品牌 banner + 酒店外观 + 服务场景)
P1-5:图片是否有 alt 描述?
curl -s https://你的域名/ | grep -o 'alt="[^"]*"' | head -5
☐ ✅ 通过:每张图都有中文 alt 描述
☐ ❌ 未通过:alt 为空或缺失 → 补写中文描述性 alt
P1-6:是否有 Canonical URL?
curl -s https://你的域名/ | grep -c 'canonical'
☐ ✅ 通过:>= 1
☐ ❌ 未通过:= 0 → 添加
🟢 P2 优化项(有条件就做,加分项)
P2-1:Open Graph 标签
curl -s https://你的域名/ | grep -c 'og:title'
P2-2:Twitter Card
curl -s https://你的域名/ | grep -c 'twitter:card'
P2-3:网站加载速度
curl -s -w '首字节时间: %{time_starttransfer}s\n总时间: %{time_total}s\n' -o /dev/null https://你的域名/
首字节 < 1 秒为优。
P2-4:独立内容页数量
网站有多少个独立 HTML 页面?(不只是首页)
☐ 只有首页(1 页)
☐ 有 2-5 个页面
☐ ✅ 有 5+ 个页面(攻略/房型/周边等)
P2-5:多平台信源覆盖
☐ 知乎有发布过含酒店名的内容
☐ 小红书有酒店相关笔记
☐ 百家号/头条号有酒店内容
☐ 抖音有含 POI 定位的视频
📊 评分卡
| 级别 | 检测项数 | 你的得分 |
|---|---|---|
| 🔴 P0 致命缺陷 | 5 项 | /5 |
| 🟡 P1 核心项 | 6 项 | /6 |
| 🟢 P2 优化项 | 5 项 | /5 |
| **总计** | **16 项** | **/16** |
评分标准:
快速自检脚本(一键跑完 16 项)
#!/bin/bash
# 保存为 geo-check.sh,chmod +x 后运行
DOMAIN="${1:?用法: ./geo-check.sh 你的域名}"
echo "=== 酒店GEO自检: $DOMAIN ==="
echo ""
# P0
echo "[P0-1] robots.txt Bytespider: $(curl -s https://$DOMAIN/robots.txt | grep -c 'Bytespider') (期望>=1)"
echo "[P0-2] robots.txt 首行: $(curl -s https://$DOMAIN/robots.txt | head -1 | cut -c1-30)"
echo "[P0-3] JSON-LD 数量: $(curl -s https://$DOMAIN/ | grep -c 'application/ld+json') (期望>=2)"
echo "[P0-4] sitemap首行: $(curl -s https://$DOMAIN/sitemap.xml | head -1 | cut -c1-20)"
echo "[P0-5] H1标签: $(curl -s https://$DOMAIN/ | grep -c '<h1') (期望>=1)"
echo ""
# P1
echo "[P1-2] 发现型FAQ关键词: $(curl -s https://$DOMAIN/ | grep -cE '哪家好|推荐|攻略|怎么选|怎么收费|适合') (期望>=3)"
echo "[P1-4] 图片数量: $(curl -s https://$DOMAIN/ | grep -c '<img ') (期望>=3)"
echo "[P1-6] Canonical URL: $(curl -s https://$DOMAIN/ | grep -c 'canonical') (期望>=1)"
echo ""
# P2
echo "[P2-1] Open Graph: $(curl -s https://$DOMAIN/ | grep -c 'og:title') (期望>=1)"
echo "[P2-2] Twitter Card: $(curl -s https://$DOMAIN/ | grep -c 'twitter:card') (期望>=1)"
echo ""
echo "=== P1-1/P1-3/P2-4/P2-5 需要手动检查 ==="
echo "P1-1: SSH进服务器查日志 zgrep -c 'Bytespider' /var/log/nginx/access.log*"
echo "P1-3: 逐平台对比酒店名称/地址/电话是否一致"
echo "P2-4: 数一下网站有几个独立页面"
echo "P2-5: 知乎/小红书/百家号/抖音各搜一下酒店名"
你的酒店GEO打几分?
跑一遍上面的一键脚本,评论区贴出你的得分。
如果你发现 P0 全挂——别慌,太正常了。95% 的酒店网站 P0 都至少缺 2-3 项。这就是为什么现在入场做 GEO 还有红利期。
需要完整部署?宿霖酒店GEO服务帮你从 0 到 1 搭建全套技术基建 + 内容矩阵。首月体验价 ¥799(正价 ¥1,499/月)。
#酒店GEO #AI搜索优化 #自检清单 #酒店代运营 #宿霖