大家好,欢迎来到IT知识分享网。
[翻译]便携式文档格式(PDF)是一种文件格式,有助于以独立于应用软件、硬件和操作系统的形式呈现数据。
[原文]The Portable Document Format (PDF) is a file format that helps to present data in a manner that is independent of Application software, hardware, and operating systems.
Portable /ˈpɔːr.t̬ə.bəl/ 可携带的,便携的
Document /ˈdɑː.kjə.mənt/ 文档
Format /ˈfɔːr.mæt/ 格式
Independent /ˌɪn.dɪˈpen.dənt/ 独立的
Application /ˌæp.ləˈkeɪ.ʃən/ 应用
Software /ˈsɑːft.wer/ 软件
Hardware /ˈhɑːrd.wer/ 硬件
Operating System /ˈɑː.pə.reɪ.t̬ɪŋ ˈsɪs.təm/ 操作系统
[翻译]每个PDF文件包含一个固定布局平面文档的描述,包括文本、字体、图形和其他显示所需的信息。
[原文]Each PDF file holds description of a fixed-layout flat document, including the text, fonts, graphics, and other information needed to display it.
Description /dɪˈskrɪp.ʃən/ 描述
Fixed-layout /ˌfɪkst ˈleɪ.aʊt/ 固定布局
Flat /flæt/ 平面
Document /ˈdɑː.kjə.mənt/ 文档
Fonts /fɑːnts/ 字体
Graphics /ˈɡræf.ɪks/ 图形
Information /ˌɪn.fɚˈmeɪ.ʃən/ 信息
Display /dɪˈspleɪ/ 显示
[翻译]有多种库可用于通过程序创建和操作PDF文档,例如 −
[原文]There are several libraries available to create and manipulate PDF documents through programs, such as −
Libraries /ˈlaɪ.brer.i/ 库
Available /əˈveɪ.lə.bəl/ 可用的
Create /kriˈeɪt/ 创建
Manipulate /məˈnɪp.jə.leɪt/ 操作
Documents /ˈdɑː.kjə.mənts/ 文档
Programs /ˈproʊ.ɡræmz/ 程序
[翻译]Adobe PDF库 − 该库提供C++、.NET和Java等语言的API,使用它我们可以编辑、查看、打印和提取PDF文档中的文本。
[原文]Adobe PDF Library − This library provides API in languages such as C++, .NET and Java and using this we can edit, view print and extract text from PDF documents.
Adobe /əˈdoʊ.bi/ 奥多比(公司名)
Library /ˈlaɪ.brer.i/ 库
API /ˌeɪ.piˈaɪ/ 应用程序接口
Edit /ˈed.ɪt/ 编辑
Extract /ɪkˈstrækt/ 提取
Text /tekst/ 文本
[翻译]格式化对象处理器 − 基于XSL格式化对象的开源打印格式化程序,输出独立于格式。主要输出目标是PDF。
[原文]Formatting Objects Processor − Open-source print formatter driven by XSL Formatting Objects and an output independent formatter. The primary output target is PDF.
Formatting /ˈfɔːr.mæt̬.ɪŋ/ 格式化
Objects /ˈɑːb.dʒekts/ 对象
Processor /ˈprɑː.ses.ɚ/ 处理器
Open-source /ˌoʊ.pənˈsɔːrs/ 开源
Formatter /ˈfɔːr.mæt̬.ɚ/ 格式化程序
Output /ˈaʊt.pʊt/ 输出
Primary /ˈpraɪ.mer.i/ 主要的
Target /ˈtɑːr.ɡɪt/ 目标
[翻译]iText − 该库提供Java、C#和其他.NET语言的API,使用该库我们可以创建和操作PDF、RTF和HTML文档。
[原文]iText − This library provides API in languages such as Java, C#, and other .NET languages and using this library we can create and manipulate PDF, RTF and HTML documents.
iText /ˈaɪ.tekst/ (库名称,无直接翻译)
API /ˌeɪ.piˈaɪ/ 应用程序接口
Java /ˈdʒɑː.və/ 爪哇(编程语言)
C# /ˌsiːˈʃɑːrp/ C#(编程语言)
.NET /ˌdɑːtˈnet/ .NET(编程平台)
Create /kriˈeɪt/ 创建
Manipulate /məˈnɪp.jə.leɪt/ 操作
RTF /ˌɑːr.tiˈef/ 富文本格式
HTML /ˌeɪtʃ.ti.emˈel/ 超文本标记语言
[翻译]JasperReports − 这是一个Java报表工具,可生成包括Microsoft Excel、RTF、ODT、逗号分隔值和XML文件的PDF文档报表。
[原文]JasperReports − This is a Java reporting tool which generates reports in PDF document including Microsoft Excel, RTF, ODT, comma-separated values and XML files.
JasperReports /ˈdʒæs.pɚ.rɪˈpɔːrts/ (工具名称,无直接翻译)
Reporting /rɪˈpɔːr.t̬ɪŋ/ 报表
Tool /tuːl/ 工具
Generates /ˈdʒen.ə.reɪts/ 生成
Microsoft /ˈmaɪ.kroʊ.sɑːft/ 微软(公司名)
Excel /ɪkˈsel/ Excel(软件名)
Comma-separated /ˈkɑː.mə sɪˈpər.eɪ.t̬ɪd/ 逗号分隔
Values /ˈvæl.juːz/ 值
XML /ˌeks.emˈel/ 可扩展标记语言
What is a PDFBox 什么是PDFBox
[翻译]Apache PDFBox是一个开源Java库,支持PDF文档的开发和转换。使用该库,您可以开发创建、转换和操作PDF文档的Java程序。
[原文]Apache PDFBox is an open-source Java library that supports the development and conversion of PDF documents. Using this library, you can develop Java programs that create, convert and manipulate PDF documents.
Apache /əˈpætʃ.i/ 阿帕奇(组织名)
PDFBox /ˌpiː.diːˈef.bɑːks/ (库名称,无直接翻译)
Open-source /ˌoʊ.pənˈsɔːrs/ 开源
Library /ˈlaɪ.brer.i/ 库
Development /dɪˈvel.əp.mənt/ 开发
Conversion /kənˈvɝː.ʒən/ 转换
Manipulate /məˈnɪp.jə.leɪt/ 操作
[翻译]此外,PDFBox还包括一个命令行实用工具,可使用提供的Jar文件对PDF进行各种操作。
[原文]In addition to this, PDFBox also includes a command line utility for performing various operations over PDF using the available Jar file.
Command /kəˈmænd/ 命令
Utility /juːˈtɪl.ə.t̬i/ 实用工具
Operations /ˌɑː.pəˈreɪ.ʃənz/ 操作
Jar /dʒɑːr/ Jar文件(Java归档文件)
Features of PDFBox PDFBox的功能
[翻译]以下是PDFBox的显著功能 −
[原文]Following are the notable features of PDFBox −
Notable /ˈnoʊ.t̬ə.bəl/ 显著的
Features /ˈfiː.tʃɚz/ 功能
[翻译]提取文本 − 使用PDFBox,您可以从PDF文件中提取Unicode文本。
[原文]Extract Text − Using PDFBox, you can extract Unicode text from PDF files.
Extract /ɪkˈstrækt/ 提取
Unicode /ˈjuː.nɪ.koʊd/ 统一码
Text /tekst/ 文本
[翻译]拆分与合并 − 使用PDFBox,您可以将单个PDF文件拆分为多个文件,并将它们合并为一个文件。
[原文]Split & Merge − Using PDFBox, you can divide a single PDF file into multiple files, and merge them back as a single file.
Split /splɪt/ 拆分
Merge /mɝːdʒ/ 合并
Divide /dɪˈvaɪd/ 分割
Multiple /ˈmʌl.tə.pəl/ 多个
[翻译]填写表单 − 使用PDFBox,您可以在文档中填写表单数据。
[原文]Fill Forms − Using PDFBox, you can fill the form data in a document.
Fill /fɪl/ 填写
Forms /fɔːrmz/ 表单
Data /ˈdeɪ.t̬ə/ 数据
[翻译]打印 − 使用PDFBox,您可以使用标准的Java打印API打印PDF文件。
[原文]Print − Using PDFBox, you can print a PDF file using the standard Java printing API.
Print /prɪnt/ 打印
Standard /ˈstæn.dɚd/ 标准的
API /ˌeɪ.piˈaɪ/ 应用程序接口
[翻译]保存为图像 − 使用PDFBox,您可以将PDF保存为图像文件,例如PNG或JPEG。
[原文]Save as Image − Using PDFBox, you can save PDFs as image files, such as PNG or JPEG.
Save /seɪv/ 保存
Image /ˈɪm.ɪdʒ/ 图像
PNG /ˌpiː.enˈdʒiː/ 便携式网络图形格式
JPEG /ˈdʒeɪ.peɡ/ 联合图像专家组格式
[翻译]创建PDF − 使用PDFBox,您可以通过创建Java程序来创建新的PDF文件,并且可以包含图像和字体。
[原文]Create PDFs − Using PDFBox, you can create a new PDF file by creating Java programs and, you can also include images and fonts.
Create /kriˈeɪt/ 创建
Include /ɪnˈkluːd/ 包含
Images /ˈɪm.ɪdʒɪz/ 图像
Fonts /fɑːnts/ 字体
[翻译]签名 − 使用PDFBox,您可以为PDF文件添加数字签名。
[原文]Signing − Using PDFBox, you can add digital signatures to the PDF files.
Signing /ˈsaɪ.nɪŋ/ 签名
Digital /ˈdɪdʒ.ɪ.t̬əl/ 数字的
Signatures /ˈsɪɡ.nə.tʃɚz/ 签名
Applications of PDFBox PDFBox的应用
[翻译]以下是PDFBox的应用 −
[原文]The following are the applications of PDFBox −
Applications /ˌæp.ləˈkeɪ.ʃənz/ 应用
[翻译]Apache Nutch − Apache Nutch是一个开源网络搜索软件。它基于Apache Lucene,增加了网络特定功能,如爬虫、链接图数据库、HTML和其他文档格式的解析器等。
[原文]Apache Nutch − Apache Nutch is an open-source web-search software. It builds on Apache Lucene, adding web-specifics, such as a crawler, a link-graph database, parsers for HTML and other document formats, etc.
Apache /əˈpætʃ.i/ 阿帕奇(组织名)
Nutch /nʌtʃ/ (软件名称,无直接翻译)
Web-search /ˈweb sɝːtʃ/ 网络搜索
Software /ˈsɑːft.wer/ 软件
Lucene /luˈsiːn/ (软件名称,无直接翻译)
Crawler /ˈkrɑː.lɚ/ 爬虫
Link-graph /ˈlɪŋk ɡræf/ 链接图
Database /ˈdeɪ.t̬ə.beɪs/ 数据库
Parsers /ˈpɑːr.sɚz/ 解析器
[翻译]Apache Tika − Apache Tika是一个工具包,用于检测和提取各种文档的元数据和结构化文本内容,使用现有的解析器库。
[原文]Apache Tika − Apache Tika is a toolkit for detecting and extracting metadata and structured text content from various documents using existing parser libraries.
Tika /ˈtiː.kə/ (工具名称,无直接翻译)
Toolkit /ˈtuːl.kɪt/ 工具包
Detecting /dɪˈtek.tɪŋ/ 检测
Extracting /ɪkˈstræk.tɪŋ/ 提取
Metadata /ˈmet̬.ə.deɪ.t̬ə/ 元数据
Structured /ˈstrʌk.tʃɚd/ 结构化的
Content /ˈkɑːn.tent/ 内容
Parser /ˈpɑːr.sɚ/ 解析器
Libraries /ˈlaɪ.brer.i/ 库
Components of PDFBox PDFBox的组件
[翻译]以下是PDFBox的四个主要组件 −
[原文]The following are the four main components of PDFBox −
Components /kəmˈpoʊ.nənts/ 组件
Main /meɪn/ 主要的
[翻译]PDFBox − 这是PDFBox的主要部分,包含与内容提取和操作相关的类和接口。
[原文]PDFBox − This is the main part of the PDFBox. This contains the classes and interfaces related to content extraction and manipulation.
Content /ˈkɑːn.tent/ 内容
Extraction /ɪkˈstræk.ʃən/ 提取
Manipulation /məˌnɪp.jəˈleɪ.ʃən/ 操作
Classes /ˈklæs.ɪz/ 类
Interfaces /ˈɪn.t̬ɚ.feɪ.sɪz/ 接口
[翻译]FontBox − 包含与字体相关的类和接口,使用这些类我们可以修改PDF文档中文本的字体。
[原文]FontBox − This contains the classes and interfaces related to font, and using these classes we can modify the font of the text of the PDF document.
FontBox /ˈfɑːnt.bɑːks/ (组件名称,无直接翻译)
Font /fɑːnt/ 字体
Modify /ˈmɑː.dɪ.faɪ/ 修改
Text /tekst/ 文本
[翻译]XmpBox − 包含处理XMP元数据的类和接口。
[原文]XmpBox − This contains the classes and interfaces that handle XMP metadata.
XmpBox /ˌeks.emˈpiː.bɑːks/ (组件名称,无直接翻译)
Handle /ˈhæn.dəl/ 处理
XMP /ˌeks.emˈpiː/ 可扩展元数据平台
Metadata /ˈmet̬.ə.deɪ.t̬ə/ 元数据
[翻译]Preflight − 该组件用于验证PDF文件是否符合PDF/A-1b标准。
[原文]Preflight − This component is used to verify the PDF files against the PDF/A-1b standard.
Preflight /ˈpriː.flaɪt/ 预检
Verify /ˈver.ɪ.faɪ/ 验证
Standard /ˈstæn.dɚd/ 标准
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/181462.html