访问这个链接查看源码很多东西.类似window.resourceLocator.storeSetup = {"defaultChannel":"service","results":[{"storeName":"北京直信创邺-广州天河区店","storeURL":"","storeEmail":"GSX-TH at sogservice.com.cn","phoneNumber":"020-38889171","distance":"2.8 km","locationData":{"streetAddress1":"广东省广州市天河区天河路490号壬丰大厦(西厅)17楼1703室","streetAddress2":"","city":"广州","state":"广东","postalCode":"510630","country":"CN","district":"天河区","regionName":"这样的信息.
怎么抓取源码并截取字符串得到以下这样格式的信息呢
[北京直信创邺-广州天河区店2.4 km
广东省广州市天河区天河路490号壬丰大厦(西厅)17楼1703室
广州, 广东 510630
020-38889171]
我试了 file()函数 file_get_contents()函数 curl等方式都无法抓取.请教高手们!谢谢~~100财富太少了!但最多只能设置这个.帮忙解决这个问题1700财富全给了.这个问题困扰了我很久怎么抓取都是空的.呜呜~~~
非常谢谢你回答.抓取到全是乱码.还有我只需要下面这些信息怎么提取出呢?谢谢高手
北京直信创邺-广州天河区店2.4 km
广东省广州市天河区天河路490号壬丰大厦(西厅)17楼1703室
广州, 广东 510630
020-38889171
乱码可能是你的php脚本编码问题,改为utf-8就应该没问题。
你需要的信息使用的是json格式,提取应该用正则表达式,有一定的复杂性,能搞定就是需要花时间和精力。
还是不行.再试了一下就出错了"Google 已禁止对此应用使用地图 API。 此网站未获授权,无法使用您提供的 Google 地图客户端 ID。如果您是此应用的所有者,请访问以下网址详细了解如何注册网址:https://developers.google.com/maps/documentation/business/guide#URLs"
郁闷 还是抓不到.
我这边是可以的啊,你右键浏览器查看一下源代码
window.resourceLocator.setup = 这部分json数据内容的就是你想要的
一堆这样的东西.都抓不到想要的东西.郁闷啊!
你的index.php文件不是utf-8格式的,而你所要获取的页面使用的是utf-8格式,这样就会出现乱码,最简单解决办法就是把你的index.php文件另存为utf-8格式,你可以用notepad+来打开php文件,然后点 格式-- 以utf-8无BOM格式编码,然后在保存,再刷新浏览器试试。
是utf-8无BOM格式了.抓不到里面的数据.你试试随便抓个字符串看看能否抓到
追答图片这里就是啦,图片看不到?
看的到图片啊.我说抓不到里面的数据.你试试echo substr($result,6,5);截取部分数据.你试试能抓到不.
追答要用正则来处理
追问我知道要获取想要那些数据需要正则来提取.我现在测试随便抓取源码里面的字符都截取不到
追答你要用 substr 你先把字符串中的空格去掉,然后别只截取一两个字符,汉字的特殊性你懂的