脚本专栏 
首页 > 脚本专栏 > 浏览文章

Ruby实现网页图片抓取

(编辑:jimmy 日期: 2025/1/10 浏览:3 次 )

前段时间看到很多人写的下妹子脚本,自己也写一个

module CommonHelper
 
 require 'nokogiri'
 require 'open-uri'
 
 def down_load_xmz
  site_url = "http://www.xxx.com"
 
  for index_page in 1..141
   doc_html = Nokogiri::HTML(open(site_url+'/share/comment-page-'+index_page.to_s))
   doc_html.css("#comments p img").each do |item_img|
    puts item_img[:src]
    download_img(item_img[:src])
   end
  end
 end
 
 ########下载图片
 def download_img(img_url)
  begin
   img_file = open(img_url) { |f| f.read }
   file_name = img_url.split('/').last
   #puts file_name
   open("public/meizi/"+file_name, "wb") { |f| f.write(img_file) }
   return "/public/meizi/"+file_name
  rescue => err
   puts err
   return ''
  end
 end
 
end

上一篇:Ruby程序中发送基于HTTP协议的请求的简单示例
下一篇:Ruby中任务构建工具rake的入门学习教程