转到配置 > 内容 > 内容区域
Posted: Tue Dec 24, 2024 6:52 am
要打开 JavaScript 渲染:
导航到配置 > 爬网配置 > 蜘蛛 > 渲染 > JavaScript。
打开 JavaScript 渲染并保留原有设置。点击“确定”。
优化抓取设置
转到配置 > 爬网配置 > 爬网。
我使用的设置专注于仅抓取文本 阿根廷电话号码库 页面内容和内部链接。根据您的网站结构,您可以选择包含子域名。
Screaming Frog 优化抓取设置的屏幕截图,显示了重点关注文本页面内容和内部链接的选项
设置要提取的数据
前往配置>爬网配置>蜘蛛>提取。
仅提取您需要的数据,以使文件大小易于管理。请参阅我的屏幕截图以查看我使用的设置。
屏幕截图显示了 Screaming Frog 在“提取”选项卡下的数据提取设置
检查高级设置
导航到配置>爬网配置>蜘蛛>高级。
按照屏幕截图所示复制设置。
屏幕截图显示了 Screaming Frog 中的“高级”蜘蛛设置
排除页眉和页脚链接
目标是避免在我们发现的机会中包含页眉和页脚导航链接。您可以将此列表复制并粘贴到所有三个框中:
导航
导航
头
标头
页脚
菜单
检查网站的页眉和页脚,以确定要排除的标签、类和 ID。右键单击页眉/页脚部分,选择“检查”,然后查找最顶部的类或 ID。
导航到配置 > 爬网配置 > 蜘蛛 > 渲染 > JavaScript。
打开 JavaScript 渲染并保留原有设置。点击“确定”。
优化抓取设置
转到配置 > 爬网配置 > 爬网。
我使用的设置专注于仅抓取文本 阿根廷电话号码库 页面内容和内部链接。根据您的网站结构,您可以选择包含子域名。
Screaming Frog 优化抓取设置的屏幕截图,显示了重点关注文本页面内容和内部链接的选项
设置要提取的数据
前往配置>爬网配置>蜘蛛>提取。
仅提取您需要的数据,以使文件大小易于管理。请参阅我的屏幕截图以查看我使用的设置。
屏幕截图显示了 Screaming Frog 在“提取”选项卡下的数据提取设置
检查高级设置
导航到配置>爬网配置>蜘蛛>高级。
按照屏幕截图所示复制设置。
屏幕截图显示了 Screaming Frog 中的“高级”蜘蛛设置
排除页眉和页脚链接
目标是避免在我们发现的机会中包含页眉和页脚导航链接。您可以将此列表复制并粘贴到所有三个框中:
导航
导航
头
标头
页脚
菜单
检查网站的页眉和页脚,以确定要排除的标签、类和 ID。右键单击页眉/页脚部分,选择“检查”,然后查找最顶部的类或 ID。