【微信打印源码】【curl源码下载】【任务发布源码】pdfbox 源码

时间:2025-01-19 07:02:16 来源:mallweb 源码 编辑:布丁直播源码

1.我想问下 JAVA中 如何读取PDF文件里面的源码内容 谁给个详细的 例子 谢谢

pdfbox 源码

我想问下 JAVA中 如何读取PDF文件里面的内容 谁给个详细的 例子 谢谢

       用Java简单的读取pdf文件中的数据:

       第一步:下载PDFBox-0.7.2.jar。提供一个下载地址:/Resource.aspx?源码CID=--4ae1-b-c9e&RID=cd8f-1cee-b6-a3df-0eff8e0d2解压后,把lib文件下的源码微信打印源码PDFBox-0.7.2.jar,PDFBox-0.7.2-log4j.jar放到你classpath路径下。源码(我把源码以及jar包都放到下面的源码curl源码下载附件里,方面你的源码任务发布源码使用。)

       第二步:写个简单的源码读取pdf文件的程序。(PdfReader.java)

       import java.io.File;

       import java.io.FileOutputStream;

       import java.io.OutputStreamWriter;

       import java.io.Writer;

       import java.net.MalformedURLException;

       import java.net.URL;

       import org.pdfbox.pdmodel.PDDocument;

       import org.pdfbox.util.PDFTextStripper;

       public class PdfReader {

        public void readFdf(String file) throws Exception {

        // 是源码否排序

        boolean sort = false;

        // pdf文件名

        String pdfFile = file;

        // 输入文本文件名称

        String textFile = null;

        // 编码方式

        String encoding = "UTF-8";

        // 开始提取页数

        int startPage = 1;

        // 结束提取页数

        int endPage = Integer.MAX_VALUE;

        // 文件输入流,生成文本文件

        Writer output = null;

        // 内存中存储的源码PDF Document

        PDDocument document = null;

        try {

        try {

        // 首先当作一个URL来装载文件,如果得到异常再从本地文件系统//去装载文件

        URL url = new URL(pdfFile);

        //注意参数已不是源码以前版本中的URL.而是File。

        document = PDDocument.load(pdfFile);

        // 获取PDF的源码文件名

        String fileName = url.getFile();

        // 以原来PDF的名称来命名新产生的txt文件

        if (fileName.length() > 4) {

        File outputFile = new File(fileName.substring(0, fileName

        .length() - 4)

        + ".txt");

        textFile = outputFile.getName();

        }

        } catch (MalformedURLException e) {

        // 如果作为URL装载得到异常则从文件系统装载

        //注意参数已不是以前版本中的URL.而是File。

        document = PDDocument.load(pdfFile);

        if (pdfFile.length() > 4) {

        textFile = pdfFile.substring(0,源码 pdfFile.length() - 4)

        + ".txt";

        }

        }

        // 文件输入流,写入文件倒textFile

        output = new OutputStreamWriter(new FileOutputStream(textFile),源码Java类源码

        encoding);

        // PDFTextStripper来提取文本

        PDFTextStripper stripper = null;

        stripper = new PDFTextStripper();

        // 设置是否排序

        stripper.setSortByPosition(sort);

        // 设置起始页

        stripper.setStartPage(startPage);

        // 设置结束页

        stripper.setEndPage(endPage);

        // 调用PDFTextStripper的writeText提取并输出文本

        stripper.writeText(document, output);

        } finally {

        if (output != null) {

        // 关闭输出流

        output.close();

        }

        if (document != null) {

        // 关闭PDF Document

        document.close();

        }

        }

        }

        /

**

        * @param args

        */

        public static void main(String[] args) {

        // TODO Auto-generated method stub

        PdfReader pdfReader = new PdfReader();

        try {

        // 取得E盘下的SpringGuide.pdf的内容

        pdfReader.readFdf("E:\\SpringGuide.pdf");

        } catch (Exception e) {

        e.printStackTrace();

        }

        }

       }

        这样就简单的完成了从pdf中读取数据了。在你的源码pdf文件所在的目录下生成一个同名的txt文件。

源码动漫app源码

copyright © 2016 powered by 皮皮网   sitemap