本软件(覃道明网文采集器)可以用来采集网络文章、网络小说。软件内置智能高速引擎,采集速度飞快。文章采集到本地后以TXT格式保存,并记录采集页序。文章采集好以后,可以借助 覃道明手机电子书助手 进行格式处理、去除杂符,然后一键生成方便在手机端阅读的TXT格式电子书。以下为软件使用教程。
本软件采集的目标网址必须符合这一规则:目标网址从开始页,到结束页,网址的变化只体现在一组(个)数字的递增或递减上。例如:
http://www.xxxxx.com/xxxxx/page1.html
http://www.xxxxx.com/xxxxx/page2.html
http://www.xxxxx.com/xxxxx/page3.html
http://www.xxxxx.com/xxxxx/page4.html
http://www.xxxxx.com/xxxxx/page5.html
http://www.xxxxx.com/xxxxx/page6.html
...... ...... ...... ...... ......
http://www.xxxxx.com/xxxxx/page300.html
网址中不变的部分字符“http://www.xxxxx.com/xxxxx/page”与“.html”之间变化的数值以“{变化页码}”替换后,就成“网址模型”:http://www.xxxxx.com/xxxxx/page{变化页码}.html;上例中,{变化页码}开始值:1,{变化页码}结束值:300。
用浏览器打开要采集的网页,查看源代码,“charset=”之后的值就是“网页编码”的值;网页标题、文章内容的开始值、结束值请如实设置;然后,选择保存目录,按下“开始采集”就可以执行采集任务。
如果采集到的文章用于制作TXT格式的电子书,请勾中“记录页序”。勾中此项,采集到的文章标题前将自动加入“1---”、“2---”、“3---”...(成书时会自动删掉),以便生成的书按页序排序。
特此敬示:网络著作受版权法保护,请在合法的前提下使用本软件,否则产生的一切后果与软件开发者及下载网站无关!
注:本软件运行的WINDOWS系统需要装有 Microsoft .NET Framework