C# 将PDF文档转换为Word文档
一.开发框架:
.NetCore6.0
(图片来源网络,侵删)
工具:Visual Studio 2022
二.思路:
1.使用SHA256Hash标识文档转换记录,数据库已经存在对应散列值,则直接返还已经转换过的文档
2.数据库没有对应散列值记录的话,则保存上传PDF文档,并进行文档转换,保留Word
3.转换成功,则在数据库记录对应文档的转换记录,用散列值做标识
三.C#后台包:
1.方法一:Spire.PDF转换包(免费的只能一次转换10页)
3.mssql数据库连接包
4.iTextSharp包转换Word文档时,文档格式包
(图片来源网络,侵删)
四:C#代码案例:
1.PDF转Word方法:
a.方法一:Spire.PDF包,PDF转Word方法(旧版,有页码限制):
/// /// PDF文件转化为Word文件 /// /// /// public static void ConvertPdfToWord(string pdfFilePath, string wordFilePath) { try { Spire.Pdf.PdfDocument pdfDoc = new Spire.Pdf.PdfDocument(); pdfDoc.LoadFromFile(pdfFilePath); pdfDoc.SaveToFile(wordFilePath, Spire.Pdf.FileFormat.DOCX); pdfDoc.Close(); } catch (Exception ex) { Console.WriteLine("Error converting PDF to Word: " + ex.Message); } }
b.iTextSharp包,没有页码限制:
/// /// iTextSharp库PDF文件转Word文件 /// /// /// public static void ConvertPdfToWordByText(string pdfFilePath, string wordFilePath) { using (iText.Kernel.Pdf.PdfReader reader = new iText.Kernel.Pdf.PdfReader(pdfFilePath)) { using (iText.Kernel.Pdf.PdfDocument pdfDoc = new iText.Kernel.Pdf.PdfDocument(reader)) { Spire.Doc.Document doc = new Spire.Doc.Document(); for (int i = 1; i
文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。
还没有评论,来说两句吧...