一.产品概述 金软PDF文本抽出工具是一款由北京博信施科技有限公司独立开发的专门从PDF文件批量抽出文本到文本文件中的工具,它可以批处理同时为多个PDF文件抽出文本,功能强大。 本程序支持的PDF版本: PDF 1.0 PDF 1.1 PDF 1.2 PDF 1.3 PDF 1.4 PDF 1.5 PDF 1.6 PDF 1.7 可以从上述文件的各种编码字符集数据中抽取文本。 本程序支持的可转换的字符集: EUC-JP EUC-JP-FIX ISO-10646-UCS-2 ISO-10646-UCS-4 ISO-2022-JP ISO-8859-1 Shift_JIS UTF-16 UTF-8、WINDOWS31J ChineseGBK ChineseBIG5 GB18030 KoreanKSC Shift_JIS-2004 ISO-2022-JP-2004 EUC-JIS-2004 本程序支持的可抽出的字符串: Unicode字符集 日语 英语(只限于拉丁字母字符集ISO_8859-1) 汉语(简体字 GB18030、GBK、繁体字Big5) 韩语(KS_C_5601_1987)的字符串 使用上述语言外的字体时,无法保证抽出结果的正确性。 抽出后的文本有17种字符编码集可供选择。抽出后文本的编码方式所使用的基本字符集中所没有的字符,转换为类似的字符(1个字符或1个字符的组合)。当没有类似的字符时替换为"〓"(2个字节)、"?" (1个字节)。 无法从有密码保护的文件中抽出文本。有密码保护的文件必须事先在源程序中解除安全设置。 金软PDF文本抽出工具还具有快速、稳定、安全的特点,其操作方便,简单;界面清爽,灵动。它是PDF的一个辅助软件,其操作方便简单。 二.功能介绍 1. 支持17种常见可转换字符集 2. 支持5中常见的语言 3.支持在输出文件名末尾加文件生成日期后缀 4. 支持批量处理,操作简便,节省您的时间