您当前的位置: 首页 >  彭世瑜

PDF文件结构

彭世瑜 发布时间:2018-12-17 14:03:38 ,浏览量:3

pdf(Portable Document Format的简称,意为“便携式文档格式”),是由Adobe Systems用于与应用程序、操作系统、硬件无关的方式进行文件交换所发展出的文件格式

PDF文件结构四个部分
  1. 文件头 Header
  2. 文件体 Body
  3. 交叉引用表 Cross-reference table
  4. 文件尾 Trailer

更新方式:采用增量更新

PDF文件支持8种基本类型对象
  1. 布尔
true和false
  1. 整数和实数
549
  1. 字符串
(This is a string)  % 可见字符
  % 16进制
  1. 名称
/Type
  1. 数组
[549 3.14false (Ralph) /SomeName]
  1. 字典
>

  1. 流对象
stream

流资料

Endstream
  1. 空对象
以null来表示
各种对象的辨识方法

(1) 以(开头:字符串对象

(2) 以/开头:名称对象

(3) 以<开头:若后面不接 startxref 553 %%EOF

解释 (1)trailer 说明文件尾 trailer对象的开始 (2)/Size 8 说明该PDF文件的对象数目 (3)/Root 1 0 R 说明根对象的对象号为1 (4)Startxref 553说明交叉引用表的偏移地址,从而可以找到PDF文档中所有的对象的相对地址,进而访问对象。 (5)%%EOF 为文件结束标志

参考

  1. https://baike.baidu.com/item/pdf/317608
  2. PDF学习二:PDF文件物理结构
  3. PDF文档结构说明
关注
打赏
1688896170
查看更多评论

彭世瑜

暂无认证

  • 3浏览

    0关注

    2727博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文
立即登录/注册

微信扫码登录

0.0701s