C语言之输入输出

标准库 IO

输入输出功能并非C语言的组成部分,ANSI标准定义了相关的库函数

输入输出 <stdio.h>

流stream是与设备关联的数据的源或者目的地。

  • 文本流:由文本行组成的序列
    不同系统的特性可能不一样,比如行最大长度和行结束符
  • 二进制流:未经处理的字节序列

程序运行时,默认打开 stdin, stdout, stderr

标准 IO 常量

  • EOF:文件尾,实际值是几个字符避免混淆
  • FOPEN_MAX:一个程序同时最多能够打开的文件数量,与编译器有关,值至少为 8
  • FILENAM_MAX:编译器支持的最长文件名

文件流操作

文件指针指向包含文件信息的结构,包括缓冲区,读写状态等

打开与关闭

FILE *fopen(const char *filename, const char *mode);                    // 打开文件流 /* mode: * r, 打开读 * w, 打开或创建写,删除原有内容 * a, 打开或者创建,文件尾追加 * +, 更新,读或写,交叉操作前需要执行fflush或者定位操作   * r+, 打开文件更新(读和写)   * w+, 创建文件更新,删除原有内容   * a+, 打开或创建文件,文件尾更新 * b, 二进制流模式  应始终检查返回值 */  FILE *freopen(const char *filename, const char *mode, FILE *stream);    // 先关闭再打开文件流  FILE *fdopen(int fd, const char *type);   // POSIX标准,常用于由创建管道和网络通信通道函数返回的描述符,不能直接用 fopen 打开 // type 参数: r, w, a, (+) // 注意读写模式下读写操作之间需要进行调用定位函数   int fclose(FILE *stream);                                               // 刷新输出缓冲,释放系统缓冲区,关闭流   int fileno(FILE *fp);   // POSIX 标准 

流的定向

标准IO可用于单字节和多字节字符集,具体由流的定向决定。

  • freopen函数清除一个流的定向
  • fwide函数设置流的定向、
#include <stdio.h> #include <wchar.h>  int fiwde(FILE *fp, int mode); /* mode<0, 试图设置为单字节 mode>0,试图设置为多字节 mode=0,不设置定向,返回流的定向  不会改变已经设置的流定向 */ 

文件操纵函数

重命名

int remove(FILE *stream);                               // 删除文件  int rename(const char *oldname, const char *newname); // 重命名文件 

临时文件

FILE *tmpfile(void);     // 以`wb+`模式创建临时文件,在关闭或者程序结束时自动删除 // 实现上tmpnam,创建文件,unlink(不会删除内容),文件的关闭会在程序结束中自动进行  char *tmpnam(char s[L_tmpnam]); // 创建不同现有文件名的字符串,NULL返回指向静态数组的指针  // UNIX 优势是不存在时间间隙,避免其他进程创建同名文件 char *mkdtemp(char *temple);  // 创建目录 int mkstmp(char *temple);     // 创建文件,不会自动删除 

缓冲操作

标准IO提供缓冲的目的是尽可能减少read/write的调用次数

  • 全缓冲:缓冲区满了才进行实际IO操作

  • 行缓冲:遇到换行符才进行IO操作

    • 行缓冲的长度是固定的,行缓冲满了即使没有换行符也会进行IO操作
    • 标准IO要求从不带缓冲或者行缓冲(需要从内核请求数据)获取数据,会立即刷新所有行缓冲的输出流
  • 不带缓冲

ISO C标准

  • 当且仅当标准输入和标准输出不指向交互式设备才是全缓冲的
  • 标准错误不会是全缓冲的

默认情况

  • 标准错误不带缓冲
  • 若是指向终端设备的流,则是行缓冲的,否则是全缓冲的

更换缓冲的类型:流被打开之后,且在执行任何操作之前

int fflush(FILE *stream);                                               // 刷新缓冲区 /* - 对于输出流,刷新写入缓冲区的内容至目标文件 - 对于输入流,其结果是未定义的 - NULL,刷新所有的缓冲区  实际使用技巧:每个调试 printf 之后立马调用 fflush */  int setvbuf(FILE *stream, char *buf, int mode, size_t size);            // 必须在执行读写操作之前设置缓冲 /* mode: - _IOFBF 完全缓冲 - _IOLBF 行缓冲 - _IONBF 不设置缓冲 */  void setbuf(FILE *stream, char *buf);     // char buf[BUFSIZ] /* - buff为 NULL, 关闭缓冲 - 否则,等价于 `_IOFBF`  // 注意:buf 不要使用自动变量类型,尽量使用系统缓冲区或者动态分配内存 */ 

​#TODO#​查看流缓冲状态 《UNIX高级环境编程》

读写流操作

字符 IO

​#TODO#​输入输出函数家族 《C和指针》P301

int fgetc(FILE *stream);  // unsigned char 转 int, 兼容EOF int getc(FILE *stream);   // 等价于 fgetc,注意实现为宏 int getchar(void);        // 等价于 getc(stdin)  int fputc(int c, FILE *stream); int putc(int c, FILE *stream);  // 等价于 fputc, 注意实现为宏 int putchar(int c);             // 等价于 fputc(stdout)  // 只有fgetc和fputc是函数,其他都是宏  int ungetc(int c, FILE *stream);  // 将字符退回流中,依赖于当前位置 // 不同于写操作,仅涉及流本身而无关设备存储 

未格式化的行IO

char *fgets(char *s, int n, FILE *stream);  // 自动包含换行符,n 换为 ,最多n-1 char *gets(char *s);                        // 不自动包含换行符。没有缓冲区长度参数,可能导致越界;不推荐使用,已废弃   int fputs(const char *s, FILE *stream);     // 不自动包含换行符n,逐字符输入任意个数换行符 int puts(const char *s);                    // 自动添加换行符n  ssize_t getline(char **lineptr, size_t *n, FILE *stream); // 根据输入动态分配内存,无需预先确定输入字符串的最大长度 // 在存储的字符串中将换行符替换为字符串结束符'' 

格式化 IO

int fprintf(FILE *stream, const char *format, ...); int printf(const char *format, ...);                  // 等价于 `fprintf(stdout, fotmat, ...)` int sprintf(char *s, const char *format, ...);        // 包含结束符 NUL,无长度参数,可能越界溢出 int snprintf(char *buf, szie_t n, const char *format, ...); // 超出部分截断,出错返回负值  int fdprintf(int fd, const char *format, ...);  // 变长参数列表变体 int vprintf(const char *format, va_list arg); int vfprintf(FILE *stream, const char *format, va_list arg); int vsprintf(char *s, const char *format, va_list arg); 

转换格式:

  • 普通字符:复制到输出流

  • 转换说明:控制参数的格式转换

    • 开头 %

    • 标志[可选]

      • -​左对齐,缺省为右对齐
      • +​显示正负号
      • 空格 有符号值转换
      • 0​ 宽度不足时填充 0
      • #​指定另一种输出形式
    • 宽度数值[可选]:指定最小字段宽度

    • 精度数值[可选]:点号开始,后接十进制数值

    • 长度修饰符[可选]:指定参数的长度

      • h 按照short/unsigned short 输出
      • l 按照long/unsigned long 输出
      • L 按照long double 输出
    • 结尾: 转换字符, d, c, s, f, x等

int fscanf(FILE *stream, const char *format, ...); int scanf(const char *format, ...); int sscanf(const char *s, char *format, ...);  int fdscanf(int fd, const char *format,...);  // 变长参数列表变体 ... 
  • 参数必须是指针
  • 到文件尾或者出错返回EOF,否则返回实际输入的字符数

转换格式

  • 空格或者制表符

  • 普通字符:匹配下一个输入

  • 转换说明

    • 开始标志%​[可选]
    • 赋值屏蔽符号*​[可选]
    • 最大字段宽度数值[可选]
    • 限定符 hlL​,指定参数的长度[可选]
    • 结束标志:转换字符 d,f,c, s, x等等

​#TODO#​4种使用场景P309

二进制 IO

直接IO/二进制IO,通常一次处理一个结构,能够处理null字节和换行符。

注意事项:只能用于同一系统,不同系统的偏移对齐以及存储格式可能不同。因此网络通信需要指定规范。

size_t fread(void *buffer, size_t size, size_t nobj, FILE *stream);  size_t fwrite(const void *buffer, size_t size, size_t nobj, FILE *stream);  /* 返回值是实际读写的元素的个数而非字节数 fread:少于nobj, 出错或者EOF,需要进一步分辨 fwrite:少于nobj,错误 */ 

内存流

无关文件,直接在缓冲区和主存之间进行字节IO。非常适用于字符串。

Linux支持。

FILE *fmemopen(void *buf, size_t size, const char *type); // buf=null, 读写无意义;对于null字节的处理十分特殊  FILE *open_memstream(char **bufp, size_t sizep);   // 面向字节的流  FILE *open_wmemstream(wchar_t **bufp, size_t *sizep);  // 面向宽字节的流 

文件定位函数

  • 二进制文件:使用字节偏移量,不一定支持 SEEK_END
  • 文本文件:格式不同不能使用字节,orgin=SEEK_SET, offset=0/ftell
int fseek(FILE *stream, long offset, int origin); /* - 二进制文件   - origin     - `SEEK_SET` 文件开始处     - `SEEK_CUR` 当前位置     - `SEEK_END` 文件结束处,可能不支持 - 文本文件   - `SEEK_SET`;offset是 0 或者 `ftell`返回值   - `SEEK_CUR`/`SEEK_END`:offset只能是 0  注意事项 - 行末指示符将被清除 - 退回的字符将被丢弃 - 更新模式中的读写操作切换 */  long ftell(FILE *stream);  void rewind(FILE *stream);    // 重置为起始位置 //等价于 `fseek(stream, 0L, SEEK_SET); clearerr(stream);` 
// off_t, 大于32位 UNIX 标准 off_t ftello(FILE *fp); int seeko(FILE *fp, off_t offset, int origin); 
// fpos_t ISO C标准,更加通用 int fgetpos(FILE *stream, fpos_t *ptr);  int fsetpos(FILE *stream, const fpos_t *ptr); 

错误处理函数

发生错误或者到达文件尾时会设置状态指示符

整型表达式 errno 包含错误编号,定义在 <errno.h>

  • 只有库函数失败时才会设置 errno, 成功执行并不会修改 errno
  • 任何函数都不会将常量置为0
/* ----- 流错误 -----*/ int feof(FILE *stream);     // 流设置了文件结束指示符,返回非0值  int ferror(FILE *stream);   // 流设置了错误指示符,返回非0值  int clearerr(FILE *stream); // 清除流的所有指示符 
#include <string.h> char *strerror(int crrno);  // 映射错误信息  #include  <stdio.h> int perror(const char *s);  // 打印字符串和 errno 错误信息 // 类似于 fprintf(stderr, "%s: %sn", s, "error essage"); 

标准IO的替代

标准IO 的效率不高,调用行IO需要进行两次数据的复制

  • 快速IO fio: 使用指针而不是复制整行
  • sfio: 提高速度,同时推广IO流
  • mmap

适用于嵌入式系统的更低内存要求的实现

  • uClibc C库
  • Newlib C库

参考

  • 《C程序设计语言》
  • 《UNIX 环境高级编程》
发表评论

相关文章