非常喜欢Nokogiri的简洁,尤其是根据css和xpath查找元素。有时又觉得Nokogiri太简洁了,连抓取失败重试的机制都没有。可惜在景德镇,网络经常丢包,真是郁闷。所以写这段代码,以后肯定常用。begindoc=Nokogiri::HTML(open(url).read.strip)rescueException=>exlog.error"Error:#{ex}"retryendTips:retry可以跳回begin这段代码将打印log并一直重试直到成功。估计这样写不大合适...
查看全文