酒店GEO自检清单:10分钟测出你的酒店能不能被AI搜到 | 宿霖

P0致命缺陷/P1核心项/P2优化项三级检测,每条附带curl验证命令,一键脚本跑完16项。附评分卡。

📑 目录

酒店GEO自检清单:10分钟测出你的酒店能不能被AI搜到

GEO圈有个残酷真相:大部分酒店的网站,AI爬虫根本没来过。

不是你的内容不够好,是你的门根本没打开。

这份自检清单分三个级别——P0是致命缺陷(必须立刻修),P1是核心项(本周内修),P2是优化项(有条件就修)。每条都附带验证命令,复制到终端直接跑。最后给你一个评分卡,看看你的酒店GEO打几分。


准备:获取你的网站地址

把下面命令里的 你的域名 替换成你的实际域名:

# 先确认网站可达
curl -sI https://你的域名/ | head -1
# 期望输出: HTTP/2 200 或 HTTP/1.1 200 OK

🔴 P0 致命缺陷(缺一项=AI看不到你,立刻修)

P0-1:robots.txt 是否放行国内AI爬虫?

为什么致命: 豆包用的是 Bytespider,文心一言用的是 Baiduspider。你的 robots.txt 不放行这些爬虫 = 国内 AI 引擎根本抓不到你的网站。

# 检查 Bytespider(豆包/DeepSeek)是否放行 — 期望 >= 1
curl -s https://你的域名/robots.txt | grep -c 'Bytespider'

# 检查 Baiduspider(百度/文心一言)是否放行 — 期望 >= 1
curl -s https://你的域名/robots.txt | grep -c 'Baiduspider'

# 一键检查全部6个国内爬虫
curl -s https://你的域名/robots.txt | grep -E 'Bytespider|Baiduspider|YisouSpider|360Spider|Sogou|PetalBot'

通过:Bytespider 和 Baiduspider 都已放行

未通过:缺少任何一个 → 参考《酒店GEO完全指南》第一层的 robots.txt 模板

P0-2:robots.txt 是否返回纯文本(非HTML)?

为什么致命: 有些 nginx 配置会把所有路径 fallback 到 index.html,导致 robots.txt 返回 HTML 页面。AI 爬虫看到 HTML 而非纯文本规则,直接放弃抓取。

# robots.txt 第一行应该是 "User-agent",不是 "<!DOCTYPE" 或 "<html"
curl -s https://你的域名/robots.txt | head -1

通过:输出以 User-agent 开头

未通过:输出是 HTML → nginx 需要配置 location = /robots.txt 精确匹配返回文件

P0-3:网站是否有 JSON-LD 结构化数据?

为什么致命: AI 不是"看"你的网页,是靠 JSON-LD 结构化数据理解你是谁。没有 JSON-LD = AI 不知道你的网站是酒店。

# JSON-LD 块数量 — 期望 >= 2(至少 Organization + FAQPage)
curl -s https://你的域名/ | grep -c 'application/ld+json'

通过:>= 2 块 JSON-LD

未通过:< 2 块 → 需要添加 Organization + FAQPage 结构化数据

P0-4:sitemap.xml 是否存在且格式正确?

为什么致命: sitemap 是爬虫的"目录",告诉它网站有哪些页面。没有 sitemap = 爬虫只抓首页就可能走了。

# sitemap 必须是 XML
curl -s https://你的域名/sitemap.xml | head -1

通过:输出以 开头

未通过:返回 404 或 HTML → 需要生成 sitemap.xml

P0-5:H1 标签是否存在?

curl -s https://你的域名/ | grep -c '<h1'

通过:>= 1

未通过:= 0 → 添加包含核心关键词的 H1 标题


🟡 P1 核心项(本周内修,影响AI推荐权重)

P1-1:爬虫是否真的来过?

robots.txt 放行 ≠ 爬虫来过。这是实战中最大的认知差距。

# SSH 进服务器,查爬虫到访次数
ssh root@你的服务器 "
  echo 'Bytespider:' \$(zgrep -c 'Bytespider' /var/log/nginx/access.log* 2>/dev/null)
  echo 'Baiduspider:' \$(zgrep -c 'Baiduspider' /var/log/nginx/access.log* 2>/dev/null)
"

通过:Bytespider 和 Baiduspider 都有访问记录

未通过:均为 0 → 需要主动提交(百度站长平台 + 字节生态发文)

P1-2:FAQ 中有发现型问题吗?

发现型问题 = 搜服务的人能找到你。自解释型问题 = 只有搜你品牌的人能找到。

# 检查 FAQ 中是否包含发现型关键词
curl -s https://你的域名/ | grep -cE '哪家好|推荐|攻略|怎么选|怎么收费|适合'

通过:>= 3 个发现型关键词

未通过:< 3 个 → FAQ 需要重写,加入推荐/比较/攻略型问题

P1-3:酒店名称/地址/电话在所有平台是否一致?

豆包优先翻 POI 数据库(抖音/高德/大众),不是你的网站。名称差一个字 = AI 判定不同酒店。

☐ 抖音来客名称 = 网站名称 = 高德名称 = 百度名称 = 大众点评名称 = 携程名称

☐ 地址在所有平台一字不差(含"省/市/区/路/号")

☐ 电话在所有平台一致

P1-4:首页是否有配图?

# 图片数量
curl -s https://你的域名/ | grep -c '<img '

通过:>= 3 张

未通过:< 3 张 → 至少添加 3 张配图(品牌 banner + 酒店外观 + 服务场景)

P1-5:图片是否有 alt 描述?

curl -s https://你的域名/ | grep -o 'alt="[^"]*"' | head -5

通过:每张图都有中文 alt 描述

未通过:alt 为空或缺失 → 补写中文描述性 alt

P1-6:是否有 Canonical URL?

curl -s https://你的域名/ | grep -c 'canonical'

通过:>= 1

未通过:= 0 → 添加


🟢 P2 优化项(有条件就做,加分项)

P2-1:Open Graph 标签

curl -s https://你的域名/ | grep -c 'og:title'

P2-2:Twitter Card

curl -s https://你的域名/ | grep -c 'twitter:card'

P2-3:网站加载速度

curl -s -w '首字节时间: %{time_starttransfer}s\n总时间: %{time_total}s\n' -o /dev/null https://你的域名/

首字节 < 1 秒为优。

P2-4:独立内容页数量

网站有多少个独立 HTML 页面?(不只是首页)

☐ 只有首页(1 页)

☐ 有 2-5 个页面

有 5+ 个页面(攻略/房型/周边等)

P2-5:多平台信源覆盖

☐ 知乎有发布过含酒店名的内容

☐ 小红书有酒店相关笔记

☐ 百家号/头条号有酒店内容

☐ 抖音有含 POI 定位的视频


📊 评分卡

级别检测项数你的得分
🔴 P0 致命缺陷5 项/5
🟡 P1 核心项6 项/6
🟢 P2 优化项5 项/5
**总计****16 项****/16**

评分标准:

  • 14-16 分(A 级):GEO 技术基建扎实,AI 能看到你。持续维护即可。
  • 10-13 分(B 级):有基础但缺关键项。优先修复 P0 缺失项。
  • 5-9 分(C 级):AI 大概率看不到你。P0 全部修复前,其他工作都是白做。
  • 0-4 分(D 级):你的网站在 AI 眼里是不存在的。需要从头搭建。

  • 快速自检脚本(一键跑完 16 项)

    #!/bin/bash
    # 保存为 geo-check.sh,chmod +x 后运行
    DOMAIN="${1:?用法: ./geo-check.sh 你的域名}"
    
    echo "=== 酒店GEO自检: $DOMAIN ==="
    echo ""
    
    # P0
    echo "[P0-1] robots.txt Bytespider:  $(curl -s https://$DOMAIN/robots.txt | grep -c 'Bytespider') (期望>=1)"
    echo "[P0-2] robots.txt 首行:       $(curl -s https://$DOMAIN/robots.txt | head -1 | cut -c1-30)"
    echo "[P0-3] JSON-LD 数量:          $(curl -s https://$DOMAIN/ | grep -c 'application/ld+json') (期望>=2)"
    echo "[P0-4] sitemap首行:           $(curl -s https://$DOMAIN/sitemap.xml | head -1 | cut -c1-20)"
    echo "[P0-5] H1标签:                $(curl -s https://$DOMAIN/ | grep -c '<h1') (期望>=1)"
    echo ""
    
    # P1
    echo "[P1-2] 发现型FAQ关键词:       $(curl -s https://$DOMAIN/ | grep -cE '哪家好|推荐|攻略|怎么选|怎么收费|适合') (期望>=3)"
    echo "[P1-4] 图片数量:              $(curl -s https://$DOMAIN/ | grep -c '<img ') (期望>=3)"
    echo "[P1-6] Canonical URL:         $(curl -s https://$DOMAIN/ | grep -c 'canonical') (期望>=1)"
    echo ""
    
    # P2
    echo "[P2-1] Open Graph:            $(curl -s https://$DOMAIN/ | grep -c 'og:title') (期望>=1)"
    echo "[P2-2] Twitter Card:          $(curl -s https://$DOMAIN/ | grep -c 'twitter:card') (期望>=1)"
    echo ""
    
    echo "=== P1-1/P1-3/P2-4/P2-5 需要手动检查 ==="
    echo "P1-1: SSH进服务器查日志 zgrep -c 'Bytespider' /var/log/nginx/access.log*"
    echo "P1-3: 逐平台对比酒店名称/地址/电话是否一致"
    echo "P2-4: 数一下网站有几个独立页面"
    echo "P2-5: 知乎/小红书/百家号/抖音各搜一下酒店名"

    你的酒店GEO打几分?

    跑一遍上面的一键脚本,评论区贴出你的得分。

    如果你发现 P0 全挂——别慌,太正常了。95% 的酒店网站 P0 都至少缺 2-3 项。这就是为什么现在入场做 GEO 还有红利期。

    需要完整部署?宿霖酒店GEO服务帮你从 0 到 1 搭建全套技术基建 + 内容矩阵。首月体验价 ¥799(正价 ¥1,499/月)。

    #酒店GEO #AI搜索优化 #自检清单 #酒店代运营 #宿霖

    让AI搜索推荐你的酒店

    宿霖酒店GEO代运营 — 从技术基建到内容矩阵,全套部署+验证,拿到爬虫数据才算交付。

    首月体验价 ¥799(正价 ¥1,499/月)

    了解服务方案