利用C#从pdf文档中批量提取图片和文本-千问二六

利用C#从pdf文档中批量提取图片和文本

发布于 2026-07-05 13:57:00 961 阅读

利用C#从pdf文档中批量提取图片和文本

对于可编辑的PDF，我们可以利用C#从pdf文档中批量提取图片和文本

创建VS项目

编写提取图片的方法，代码如下：

private void ExtractImage(string pdfFile)

{

PdfReader pdfReader = new PdfReader(pdfFile);

for (int pageNumber = 1; pageNumber <= pdfReader.NumberOfPages; pageNumber++)

{

PdfReader pdf = new PdfReader(pdfFile);

PdfDictionary pg = pdf.GetPageN(pageNumber);

PdfDictionary res = (PdfDictionary)PdfReader.GetPdfObject(pg.Get(PdfName.RESOURCES));

PdfDictionary xobj = (PdfDictionary)PdfReader.GetPdfObject(res.Get(PdfName.XOBJECT));

try

{

foreach (PdfName name in xobj.Keys)

{

PdfObject bj = xobj.Get(name);

if (obj.IsIndirect())

{

PdfDictionary tg = (PdfDictionary)PdfReader.GetPdfObject(obj);

string width = tg.Get(PdfName.WIDTH).ToString();

string height = tg.Get(PdfName.HEIGHT).ToString();

//ImageRenderInfo imgRI = ImageRenderInfo.CreateForXObject((GraphicsState)new Matrix(float.Parse(width), float.Parse(height)), (PRIndirectReference)obj, tg);

ImageRenderInfo imgRI = ImageRenderInfo.CreateForXObject(new GraphicsState(), (PRIndirectReference)obj, tg);

RenderImage(imgRI);

}

}catch

{

continue;

}

将图片保存到文件

private void RenderImage(ImageRenderInfo renderInfo)

{

count++;

PdfImageObject image = renderInfo.GetImage();

using (Dotnet dotnetImg = image.GetDrawingImage())

{

if (dotnetImg != null)

{

using (MemoryStream ms = new MemoryStream())

{

dotnetImg.Save(ms, ImageFormat.Tiff);

Bitmap d = new Bitmap(dotnetImg);

d.Save(@"");

}

从PDF提取文本

public void ExtractTextFromPDFPage(string pdfFile)

{

PdfReader reader = new PdfReader(pdfFile);

int n = reader.NumberOfPages;

for (int i = 1; i <= n; i++)

{

string text = PdfTextExtractor.GetTextFromPage(reader, i);

}

try { reader.Close(); }

catch { }

}

利用C#从pdf文档中批量提取图片和文本

热门文章

草字头加个良字念什么

企业微信转正提醒在哪里设置

微信如何快速恢复聊天记录

微信小程序排名怎么做

二年级带问号的句子

成功人士的意思

推荐阅读

360手机助手安装时遇到USB调试的解决方法

EXCEL在数据有效性条件中不能使用对其他工作表

苹果手机微信表情包怎么导入

农民专业合作社成员可以用什么方式出资

Excel 2013中“排序”的多种使用方法

如何用ps做两张叠在一起并且有一张是半透明

天正建筑如何画柱子

如何开启京东退出直播间后台播放

iPhone6 plus被盗/丢了关机了怎么定位找回

ps如何设置颜色

利用C#从pdf文档中批量提取图片和文本

相关文章

热门文章

推荐阅读