Tag: web crawler

Googlebot会抓取对使用JavaScript制作的DOM的更改吗?

对于SEO,我的任务是为所有外部链接*添加rel=”nofollow” 。 向每个外部链接添加rel=”nofollow”的最简单且最不显眼的方法是使用一些jQuery。 我做得很好,但我现在想知道: Google是否看到jQuery文档加载到DOM(例如此文件)期间所做的更改,还是仅查看原始源代码? 我不想讨论为什么这是个坏主意。 这是一个SEO顾问的决定,我已经了解到,除非他们最新的心血来潮的实施需要花费太多时间才能满足他们的需求

jquery中查找和filter之间的区别

我正在努力从维基页面获取数据。 我正在使用php和jquery的组合来做到这一点。 首先,我在php使用curl来获取页面内容并回显内容。 文件名是content.php : $url = $_GET[‘url’]; $url = trim($url,” “); $url = urldecode($url); $url = str_replace(” “,”%20”,$url); echo “”.$_GET[‘title’].””; echo crawl($url); 然后jQuery用于查找匹配的元素。 $.get(“content.php”,{url:”http://en.wikipedia.org/w/index.php?action=render&title=”+str_replace(” “,”_”,data[x]),title:str_replace(” “,”_”,data[x])},function(hdata){ var imgs = $(hdata).find(‘a.image img’); var ent = $(hdata).filter(‘a.urlmax’); ent = $(ent[0]).text(); }); 我能够成功获取图像,但是当我使用find而不是filter时,它变量ent,它返回一个空数组。 只有filter正常工作。 为什么是这样? 编辑:我知道查找和filter之间的基本区别。 这里的a.image img和a.urlmax都是a.urlmax的后代。 那么为什么找不到a.urlmax 。 单独不是a.urlmax它不适用于任何其他类或id