C语言中使用lex统计文本文件字符数

2025-02-20 06:43:07

我曾经在Linux上写的一个C程序，借助Lex做词法分析来同时统计N个文本文件的字符数，单词数和行数。让我觉得Lex确实挺有意思的。确实Lex的功能非常强大，用来做小巧的词法分析非常适合，也非常好用。这个程序参考了《Lex与Yacc》上的一个例子。

%{
unsigned int char_count = 0, word_count = 0, line_count = 0;
%}
%%
[^ /t/n]+ {word_count++; char_count+=yyleng;};
/n {char_count++; line_count++;};
. char_count++;
%%
char **file_list;
unsigned int current_file = 0;
unsigned int total_file = 0; 

unsigned int total_cc = 0;
unsigned int total_wc = 0;
unsigned int total_lc = 0; 

typedef struct file_info{
  unsigned int c;
  unsigned int w;
  unsigned int l;
  char *name;
}INFO; 

INFO **all; 

int create_info(int num)
{
  INFO *tmp;
  int i;
  if (num <= 0){
    return -1;
  }
  all = (INFO **)malloc(sizeof(int *)*num);
  for (i = 0; i < num; i++){
    tmp = (INFO *)malloc(sizeof(INFO));
    tmp->c = 0;
    tmp->w = 0;
    tmp->l = 0;
    tmp->name = NULL;
    all[i] = tmp;
  }
  return 1;
}   

int delete_info(int num)
{
  int i;
  if ((all == (INFO **)0) || num <= 0){
    return -1;
  }
  for (i = 0; i < num; i++){
    free(all[i]);
  }
  free(all);
  return 1;
} 

int set_info(int pos)
{
  int length = 0;
  if (pos < 0){
    return -1;
  }
  all[pos]->c = char_count;
  all[pos]->w = word_count;
  all[pos]->l = line_count;
  all[pos]->name = file_list[pos]; 

  return 1;
} 

int main(int argc, char** argv)
{
  FILE *file;
  int position = 0;
  int i; 

  file_list = argv + 1;
  total_file = argc - 1;
  current_file = 0; 

  printf("--------------------------------------------------------------/n",
 total_file);  

  if (argc > 1){
    if (create_info(total_file) == -1){
      fprintf(stderr, "%s/n", "Encounter a error when malloc memory."); 

      exit(1);
    }
  }
  if (argc == 2){        

    file=fopen(argv[1], "r");
    if (!file){
      fprintf(stderr, "Could not open %s./n", argv[1]);
      delete_info(total_file);
      exit(1);
    }
    yyin = file;
  } 

  yywrap();
  yylex(); 

  if (argc > 1){
    total_cc += char_count;
    total_wc += word_count;
    total_lc += line_count;     

    if (set_info(current_file-1) == -1){
      fprintf(stderr, "%s/n", "Encounter a error when set information to
 INFO.");
      delete_info(total_file);
      exit(1);
    }     

    for (i = 0; i < total_file; i++){
      printf("char:%-8lu word:%-8lu line:%-8lu file name:%s/n", all[i]->
c, all[i]->w, all[i]->l, file_list[i]);
    }
    printf("----------------------- total --------------------------------
/n");
    printf("chars:%-8lu words:%-8lu lines:%-8lu files:%d/n", total_cc, tot
al_wc, total_lc, total_file);
  }else{
    printf("char:%-8lu word:%-8lu line:%-8lu/n", char_count, word_count, l
ine_count);
  } 

  delete_info(total_file);
  return 0;
} 

yywrap()
{
  FILE *file = NULL; 

  if ((current_file > 0) && (current_file < total_file) && (total_file > 1))
{
    total_cc += char_count;
    total_wc += word_count;
    total_lc += line_count; 

    if (set_info(current_file-1) == -1){
      fprintf(stderr, "%s/n", "Encounter a error when set information to
 INFO.");
      delete_info(total_file);
      exit(1);
    }   

    char_count = word_count = line_count = 0;
    fclose(yyin);
  }
  while ((file_list[current_file] != (char *)0) && (current_file < total_fil
e)){ 

    file = fopen(file_list[current_file++], "r");
    if (!file){
      fprintf(stderr, "could not open %s .", file_list[current_file - 1]
);
    }else{
      yyin = file;
      break;
    }
  }
  return (file? 0 : 1);
}

C语言实现输入一个字符串后打印出该字符串中字符的所有排列

本文实例讲述了C语言实现输入一个字符串后打印出该字符串中字符的所有排列的方法,属于数学里的排列问题.是一个很实用的算法技巧.分享给大家供大家参考.具体实现方法如下: 例如输入字符串abc,则输出由字符a.b.c所能排列出来的所有字符串abc.acb.bac.bca.cab和cba. C语言实现代码如下: /* * Copyright (c) 2011 alexingcool. All Rights Reserved. */ #include <iostream> #include <al
C语言实现排序算法之归并排序详解

排序算法中的归并排序(Merge Sort)是利用"归并"技术来进行排序.归并是指将若干个已排序的子文件合并成一个有序的文件. 一.实现原理: 1.算法基本思路设两个有序的子文件(相当于输入堆)放在同一向量中相邻的位置上:R[low..m],R[m+1..high],先将它们合并到一个局部的暂存向量R1(相当于输出堆)中,待合并完成后将R1复制回R[low..high]中. (1)合并过程合并过程中,设置i,j和p三个指针,其初值分别指向这三个记录区的起始位置.合并时依次比较R[i
C语言采用文本方式和二进制方式打开文件的区别分析

稍微了解C程序设计的人都知道,文本文件和二进制文件在计算机上面都是以0,1存储的,那么两者怎么还存在差别呢?对于编程人员来说,文本文件和二进制文件就是一个声明,指明了你应该以什么方式(文本方式/二进制)打开这个文件,用什么函数读写这个文件(读写函数),怎么判断读到这个文件结尾等. 具体分析如下: 一.以哪种方式打开一个文件: ANSI C规定了标准输入输出函数库,用 fopen()函数打开文件.fopen()函数的调用方式一般为: FILE *fp; fp=fopen(文件名,使用文件方式):
c语言操作文本的基本使用方法

字符读写函数 :fgetc和fputc字符串读写函数:fgets和fputs数据块读写函数:freed和fwrite格式化读写函数:fscanf和fprinf 1.字符读写:fgetc函数的功能是从指定的文件中读一个字符,函数调用的形式为:字符变量=fgetc(文件指针):fputc函数的功能是把一个字符写入指定的文件中,函数调用的形式为:fputc(字符量,文件指针): 2.字符串读写读字符串函数fgets 函数的功能是从指定的文件中读一个字符串到字符数组中,函数调用的形式为: fgets(
C语言演示对归并排序算法的优化实现

基础如果有两个数组已经有序,那么可以把这两个数组归并为更大的一个有序数组.归并排序便是建立在这一基础上.要将一个数组排序,可以将它划分为两个子数组分别排序,然后将结果归并,使得整体有序.子数组的排序同样采用这样的方法排序,这个过程是递归的. 下面是示例代码: #include "timsort.h" #include <stdlib.h> #include <string.h> // 将两个长度分别为l1, l2的已排序数组p1, p2合并为一个 // 已排序
举例讲解C语言对归并排序算法的基础使用

基础概念百度百科是这么描述归并排序的: 归并操作(merge),也叫归并算法,指的是将两个已经排序的序列合并成一个序列的操作. 设有数列 {6,202,100,301,38,8,1} 初始状态: [6] [202] [100] [301] [38] [8] [1] 比较次数 i=1 [6 202 ] [ 100 301] [ 8 38] [ 1 ] 3 i=2 [ 6 100 202 301 ] [ 1 8 38 ] 4 i=3 [ 1 6 8 38 100 202 301 ] 4 总计: 1
用C语言实现从文本文件中读取数据后进行排序的功能

功能介绍程序的功能是从外部读取一个包括int型数据的文本文件,然后将它保存到内部临时数组,对数组进行排序后,以文本形式输出到指定的文件上.因为是int类型的数据,没有很严重的损失精度的问题. 正常运行要求: 包括数据的源文件内不能包括其他任何除数字和空白字符(空格,制表符,换行符)之外的任何字符,源文件最开始必须是数字字符,要保证源文件的数据计数正确.同时保证文件名有效. 运行结果 data.txt: obj.txt: 完整代码警告:版权所有,谨供参考! #include <stdio.h>
C语言实现修改文本文件中特定行的实现代码

好的,首先我先叙述下功能要求:其实很简单,就是Shell中sed命令的C语言实现,实现定位到所需要的字段的那一行,之后修改成需要的内容.但是由于C语言是面向过程的语言,需要顺序执行的特点,所以,实现中遇到了很多麻烦,在这里博主将实现的过程描述如下,以便大家参考. 问题描述: 文本内容: 复制代码代码如下: wireless.1.authmode=1wireless.1.compression=0wireless.1.current_ap=ssid12wireless.1.current_sta
交换两个文本内容的C语言代码

文本存储的位置: jack.txt位于: e:\jack.txt retchie.txt位于: e:\retchie.txt 内容: jack.txt -> "Hello! I am Jack." retchie.txt -> "Hello! I am Retchie." 相关代码: 复制代码代码如下: #include <stdio.h> int main(void){ char temp1[100];
C语言中使用lex统计文本文件字符数

我曾经在Linux上写的一个C程序,借助Lex做词法分析来同时统计N个文本文件的字符数,单词数和行数.让我觉得Lex确实挺有意思的.确实Lex的功能非常强大,用来做小巧的词法分析非常适合,也非常好用.这个程序参考了<Lex与Yacc>上的一个例子. %{ unsigned int char_count = 0, word_count = 0, line_count = 0; %} %% [^ /t/n]+ {word_count++; char_count+=yyleng;}; /n {cha
C语言中无符号数和有符号数之间的运算

C语言中有符号数和无符号数进行运算(包括逻辑运算和算术运算)默认会将有符号数看成无符号数进行运算,其中算术运算默认返回无符号数,逻辑运算当然是返回0或1了. unsigned int和int进行运算直接看例子来说明问题吧 #include <iostream> using namespace std; int main() { int a = -1; unsigned int b = 16; if(a > b) cout<<"负数竟然大于正数了!\n";
C语言每日练习之统计文本单词数及高频词

作业1:统计出txt文本里面的单词数,并找出频率出现最高的单词是哪个? 运行结果: 上代码: using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace ConsoleApplication1 { class Program { static void Main(string[] args) { //文件打开 //string file = System.IO.Fi
C语言中输入函数(scanf()、fgets()和gets())的区别详解

前言大家都知道在C语言中,有三种主要的输入函数:scanf(),fgets()以及gets().他们的使用方法及注意事项如下: 1.scanf() 它是一种格式化的输入方式,可一次性按照规定的格式输入多个数据域. scanf函数是一个标准库函数,它的函数原型在头文件"stdio.h"中.与printf函数相同,C语言也允许在使用scanf函数之前不必包含stdio.h文件. scanf函数的一般形式为: scanf("格式控制字符串", 地址表列); 其中,格式控
C语言中无符号与有符号及相加问题

C语言中无符号与有符号问题 unsigned char a[5] = { 12,36,96,128,182 }; a[]范围为0~256. 数组中数都有效. char a[5] = { 12,36,96,128,182 }; a[]范围为-128~127. 数组中128和182均无效. C语言中无符号数和有符号数相加问题看个题: #include<stdio.h> int main() { unsigned int a=6; int b=-20; printf("%d\n"
C语言中字符的输入输出以及计算字符个数的方法详解

C语言字符输入与输出标准库提供的输入/输出模型非常简单.无论文本从何处输入,输出到何处,其输入/输出都是按照字符流的方式处理.文本流是由多行字符构成的字符序列,而每行字符则由 0 个或多个字符组成,行末是一个换行符.标准库负责使每个输入/输出流都能够遵守这一模型.使用标准库的 C 语言程序员不必关心在程序之外这些行是如何表示的. 标准库提供了一次读/写一个字符的函数,其中最简单的是 getchar 和 putchar 两个函数.每次调用时,getchar 函数从文本流中读入下一个输入字符,并将
浅析C语言中的数组及字符数组

我们来编写一个程序,以统计各个数字.空白符(包括空格符.制表符及换行符)以及所有其它字符出现的次数.这个程序的实用意义并不大,但我们可以通过该程序讨论 C 语言多方面的问题. 所有的输入字符可以分成 12 类,因此可以用一个数组存放各个数字出现的次数,这样比使用 10 个独立的变量更方便.下面是该程序的一种版本: #include <stdio.h> /* count digits, white space, others */ main() { int c, i, nwhite, nothe
解决C语言中使用scanf连续输入两个字符类型的问题

昨天用C编程,遇到一个关于scanf的细节问题,假如运行如下程序: #include<stdio.h> int main() { char ch1,ch2; printf("Input for ch1:/n"); scanf("%c",&ch1); printf("ch1=%c/n",ch1); printf("Input for ch2:/n"); scanf("%c",&ch
PHP实现统计所有字符在字符串中出现次数的方法

本文实例讲述了PHP实现统计所有字符在字符串中出现次数的方法.分享给大家供大家参考,具体如下: 先来看看效果: 算法: 循环一次字符串(本例的$str),把出现过的字符串记录在一个数组(如本例的$strRecord)内,如果已经此记录函数已经有,则不记录: 在每个字符串时,拿来与记录数组的值进行比较(本例的$strRecord[]['key']),如果记录里的某个值和这个字符串一样,就记录次数+1(本例的$strRecord[]['count']); 当然,设置一个变量,默认为false(如本例
C语言中的字符（char）详细讲解

1.字符型(char)简介字符型(char)用于储存字符(character),如英文字母或标点. 严格来说,char 其实也是整数类型(integer type),因为 char 类型储存的实际上是整数,而不是字符. 计算机使用特定的整数编码来表示特定的字符. 2. 声明字符型变量 3. 字符常量与初始化实例: 用 char 类型来专门表示一个字符,例如: char a='1'; char b='$'; char c='X'; char d=' '; // 空格也是一个字符 char e=

C语言中使用lex统计文本文件字符数

相关推荐

随机推荐