pdf(Portable Document Format的简称,意为“便携式文档格式”),是由Adobe Systems用于与应用程序、操作系统、硬件无关
的方式进行文件交换所发展出的文件格式
- 文件头 Header
- 文件体 Body
- 交叉引用表 Cross-reference table
- 文件尾 Trailer
更新方式:采用增量更新
PDF文件支持8种基本类型对象- 布尔
true和false
- 整数和实数
549
- 字符串
(This is a string) % 可见字符
% 16进制
- 名称
/Type
- 数组
[549 3.14false (Ralph) /SomeName]
- 字典
>
- 流对象
stream
流资料
Endstream
- 空对象
以null来表示
各种对象的辨识方法
(1) 以(开头:字符串对象
(2) 以/开头:名称对象
(3) 以<开头:若后面不接 startxref 553 %%EOF
解释 (1)trailer 说明文件尾 trailer对象的开始 (2)/Size 8 说明该PDF文件的对象数目 (3)/Root 1 0 R 说明根对象的对象号为1 (4)Startxref 553说明交叉引用表的偏移地址,从而可以找到PDF文档中所有的对象的相对地址,进而访问对象。 (5)%%EOF 为文件结束标志
参考
- https://baike.baidu.com/item/pdf/317608
- PDF学习二:PDF文件物理结构
- PDF文档结构说明