读秀(www.duxiu.com)电子书下载器_.NET_编程开发_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 编程开发 > .NET > 读秀(www.duxiu.com)电子书下载器

读秀(www.duxiu.com)电子书下载器

 2014/4/28 3:29:18  ghczzz  博客园  我要评论(0)
  • 摘要:读秀上有很多电子书,不过只能以在线图片形式浏览,所以写了一个下载器可以把图片批量下载到本地。下载器需要.Netframework4.5。读秀有两种方式阅读电子书,一种是全文浏览,一般来说如果你是在高校,并且学校已经买了读秀的包库权限,那么你就可以访问到电子书的全文。另一种是咨询浏览,每次只能通过读秀发给你的邮件里面的链接浏览电子书的一部分。不过可以通过多次咨询来浏览全文,比如第一次咨询1-50页,第二次咨询51-100页,...读秀网站是需要账号才能进入,可以搜索一下,网上有很多共享出来的账号
  • 标签:下载 电子书

读秀上有很多电子书,不过只能以在线图片形式浏览,所以写了一个下载器可以把图片批量下载到本地。下载器需要.Net framework 4.5。

读秀有两种方式阅读电子书,一种是全文浏览,一般来说如果你是在高校,并且学校已经买了读秀的包库权限,那么你就可以访问到电子书的全文。另一种是咨询浏览,每次只能通过读秀发给你的邮件里面的链接浏览电子书的一部分。不过可以通过多次咨询来浏览全文,比如第一次咨询1-50页,第二次咨询51-100页,...

读秀网站是需要账号才能进入,可以搜索一下,网上有很多共享出来的账号。淘宝也有便宜的一两块钱的读秀入口。

下载器集成了一个浏览器控件(输入完网址后,点击Go button),可以通过下载器导航到电子书阅读页面,网址记得要加http://的前缀,

 

 

当导航到电子书浏览页面,Download button自动变为enable,

 

 

点击Download button后,会在应用程序目录下生成一个Download子目录,当前电子书的所有图片都会保存进去,下载过程中可以看到Download目录中不断有图片文件生成。因为读秀加入了防机器人检测,所以在下载过程中需要输入验证码,而且有时候需要输入很多次。下载过程中,当发现界面上出现图片时,在后面的textbox输入图片的文字然后点Go button。

 

当下载完成后会弹出Done消息。

 

Dwonload文件夹里面所有文件的命名规则是:

A-1...n 封面

B-1...n 书名页

C-1...n 版权页

D-1...n 前言

E-1...n 目录

F-1...n 正文页

G-1...n 附录页

H-1...n 封底

如果你有权限浏览全文,那么一次下载就可以下完整本书。

如果是咨询方式的话需要多次下载才能下载完整本书。当多次下载时不用重命名已下载文件,下载器会自动知道当前正在下载哪一页,并以页数作为文件名

 

当下载完所有图片就可以自己制作pdf文件。下载器也提供了一个简单的pdf文件生成功能,pdf button会将Download文件夹里面所有图片文件合并成一个名叫Book.pdf的文件(同样保存在Download目录)。

 

下载器引用了两个lib,一个是Jurassic,用来解析javascript代码。一个是iTextSharp,生成pdf文件。

源代码一并附上。

http://files.cnblogs.com/ghczzz/NavigatedDownloaderSource.zip

http://files.cnblogs.com/ghczzz/NavigatedDownloader.zip

发表评论
用户名: 匿名