直接采集1688产品搜索的页面数据,包括企业名称、旺旺号、价格、月成交额、产品标题、产品网址、货描、响应、发货、经营模式、供应等级、供应产品、满意度等等字段,输出为文本表格(csv)或文本文件,可用于产品行情分析、同行销售业绩评估、企业信息收集等用途。
每个产品关键词最高支持100页,每页60个产品,大约6000个产品信息。支持详细的搜索参数设置,支持多个产品关键词顺序采集,不同关键词使用|或换行隔开,支持字段排序(点击表头列)后再导出保存
特别提示
登录或验证码1688弹出的窗口,第一次是用于登录,登录完成可以立刻关闭窗口继续采集;以后是用于输入验证码,支持自己打码和雇人打码(推荐雇人打码并等待)。如果验证码频出,则每次输入验证码后让窗口自动等待15分钟才能继续采集,否则就会一直弹窗口。
内置采集间隔软件已内置采集间隔时间(每20个产品10秒),以尽量避免验证码的出现次数,经过测试,内置间隔后几乎不出现验证码或很少出现,如果不内置间隔,验证码就频繁出现而且输入无效,必须每次输入验证码后等15分钟才可能缓解验证码的频繁。所以内置间隔虽然采集慢点,但好在细水长流,可以挂着慢慢采,总比一时采快验证码不断出的强。
采集字段
默认字段搜索页面里直接显示的字段,如企业名称、旺旺号、价格、月成交额、产品标题、产品网址
鼠标移显字段鼠标移动到搜索页面的某个产品上显示的字段,如货描、响应、发货、经营模式、供应等级、供应产品、满意度。如果采集此类字段会导致速度稍微变慢,不过因为有内置采集间隔的设定(20个产品10秒),所以这种稍慢就不明显甚至不存在了(正常情况下20个产品读取鼠标移显字段不需10秒)。
联系人字段包括联系人和联系方式,需要进入企业档案页面才能读取到的字段。如果采集此字段会导致速度明显变慢(20个产品读取联系人字段20秒左右)。
评论(0)