3.6 lseek函数
每个打开的文件都有一个与其相关联的“当前文件偏移量”(current file offset)。它通常是一个非负整数,用以度量从文件开始处计算的字节数(本节稍后将对“非负”这一修饰词的某些例外进行说明)。通常,读、写操作都从当前文件偏移量处开始,并使偏移量增加所读写的字节数。按系统默认的情况,当打开一个文件时,除非指定O_APPEND选项,否则该偏移量被设置为0。
可以调用lseek显式地为一个打开的文件设置其偏移量。

对参数offset 的解释与参数whence的值有关。
• 若whence是SEEK_SET,则将该文件的偏移量设置为距文件开始处offset 个字节。
• 若whence是SEEK_CUR,则将该文件的偏移量设置为其当前值加offset,offset可为正或负。
• 若whence是SEEK_END,则将该文件的偏移量设置为文件长度加offset,offset可为正或负。
若lseek成功执行,则返回新的文件偏移量,为此可以用下列方式确定打开文件的当前偏移量:
![]()
这种方法也可用来确定所涉及的文件是否可以设置偏移量。如果文件描述符引用的是一个管道、FIFO或网络套接字,则lseek返回-1,并将errno设置为ESPIPE。
三个符号常量SEEK_SET、SEEK_CUR和SEEK_END是由系统V引入的。在系统V之前,whence被指定为0(绝对偏移量)、1(相对于当前位置的偏移量)或2(相对文件尾端的偏移量)。现有的很多软件仍然把这些数字直接写在代码里。
lseek中的字符l表示长整型。在引入off_t数据类型之前,offset参数和返回值是长整型。lseek
是由V7引入的,当时C语言中增加了长整型(在V6中,用函数seek和tell提供类似功能)。
实例
程序清单3-1中的程序用于测试能否对其标准输入设置偏移量。

如果用交互方式调用此程序,则可得:

通常,文件的当前偏移量应当是一个非负整数,但是,某些设备也可能允许负的偏移量。但对于普通文件,则其偏移量必须是非负值。因为偏移量可能是负值,所以在比较lseek的返回值时应当谨慎,不要测试它是否小于0,而要测试它是否等于-1。
在Intel x86处理器上运行的FreeBSD上的/dev/kmem设备支持负的偏移量。
因为偏移量(off_t)是带符号数据类型(见表2-16),所以文件最大长度会减少一半。例如,若off_t是32位整型,则文件最大长度是231 -1个字节。
lseek仅将当前的文件偏移量记录在内核中,它并不引起任何I/O操作。然后,该偏移量用
于下一个读或写操作。
文件偏移量可以大于文件的当前长度,在这种情况下,对该文件的下一次写将加长该文件,并在文件中构成一个空洞,这一点是允许的。位于文件中但没有写过的字节都被读为0。
文件中的空洞并不要求在磁盘上占用存储区。具体处理方式与文件系统的实现有关,当定位到超出文件尾端之后写时,对于新写的数据需要分配磁盘块,但是对于原文件尾端和新开始写位置之间的部分则不需要分配磁盘块。
程序清单3-2中的程序用于创建一个具有空洞的文件。
运行该程序得到:

使用od(1)命令观察该文件的实际内容。命令行中的-c标志表示以字符方式打印文件内容。从中可以看到,文件中间的30个未写字节都被读成为0。每一行开始的一个7位数是以八进制形式表示的字节偏移量。
为了证明在该文件中确实有一个空洞,将刚创建的文件与具有同样长度但无空洞的文件进行比较:

虽然两个文件的长度相同,但无空洞的文件占用了20个磁盘块,而具有空洞的文件只占用8个磁盘块。
在此实例中调用了将在3.8节中说明的write函数。4.12节将对具有空洞的文件进行更多说明。
因为lseek使用的偏移量是用off_t类型表示的,所以允许具体实现根据各自特定的平台自行选择大小合适的数据类型。现今大多数平台提供两组接口以处理文件偏移量:一组使用32 位文件偏移量,另一组则使用64位文件偏移量。
Single UNIX Specification向应用程序提供了一种方法,使其通过sysconf函数确定何种环境受到支持(见2.5.4节)。表3-1总结了定义的sysconf常量。

c99编译器要求使用getconf(1)命令,将所希望的数据大小模型映射为编译和连接程序所需的标志。根据每个平台支持环境的不同,可能需要不同的标志和库。
不幸的是,在这一方面,实现没有跟上标准的步伐。使人更迷惑不解的是Single UNIX Specification第2版和第3版之间更改了若干个名字。
为了避开这一点,应用程序可将符号常量_FILE_OFFSET_BITS设置为64,以支持64位偏移量。这样处理后就将off_t定义更改为64位带符号整型。将_FILE_OFFSET_BITS符号常量设置为32,就支持32位文件偏移量。但是,应当知道的是:虽然本书讨论的四种平台都支持32位和64位文件偏移量,其方法是将_FILE_OFFSET_BITS符号常量设置为所希望的值,但并不保证这是可移植的。
注意:尽管可以支持64位文件偏移量,但是否能创建一个大于2 TB(231 -1个字节)的文件则依赖于底层文件系统的类型。







