通过ajax能在一定程度上防止网页数据被采集。
要想弄明白其中的原因,首先要了解网页采集工具的工作原理,现在流行的网页采集工具绝大多数都是读取文档,从文档中采集信息。
说ajax在一定程度上可以防止网页数据被采集是因为ajax获取的数据一般是通过js生成标签,这种标签是不在文档中的,抓取工具自然就抓取不到这些数据。
ajax和js虽然利于用户体验,还能在一定程度上防止网页数据被采集,但是却不利于优化,因为搜索引擎爬取工具的工作原理跟网页抓取工具的原理是类似的,网页抓取工具抓取不到的内容,搜索引擎也抓取不到,这样就不利于网站的seo优化了。
一个网站要有自己的定位,商业型的网站要做seo优化提升搜索量,要尽量不去用ajax加载大量内容;系统型网站注重实用,可以多用ajax提升用户体验;内容原创性较高的网站也可以用ajax和js配合加载文档,防止内容被抓取。