C语言实现文件内容按行随机排列的算法示例

本文实例讲述了C语言实现文件内容按行随机排列的算法。分享给大家供大家参考,具体如下:

在实际工作上有种需求, 就是需要从给定的数据里,随机抽取一部分。

有一种简单的方法是根据总的数据条数和要抽取的数据条数, 通过简单方法,隔几行取一个,这样也能达到随机抽取一部分的目的。

但这样,源数据是顺序的,则抽取的数据也是顺序的,不满足一些情境。

这里实现的功能是: 将全部数据,按行重新随机排列, 这样从结果头部选几行,就是随机抽取的几行了,比较方便。

实现的思路:  对于N行的数据, 给每一行用[1-N]之间不重复的数做标记, 最后按标记数排列即可。(不重复上要稍微费点儿心思)

实现思路比较重要,实现就简单了~

实现上用c结合shell的方式,下面为参考代码。

总控脚本:用不重复随机数做标记,然后按标记排序

#!/bin/sh
### note: sh random.sh in_fname out_fname ###
infile=$1
outfile=$2
line_num=`cat $infile | wc -l `
./random $line_num $infile $outfile.tmp
sort $outfile.tmp -k 2 -n -t ' ' | cut -f1 > $outfile

随机化的执行程序random的实现

//random.c
#include <string>
#include <iostream>
#include <ctime>
#include <cstdlib>
using namespace std;
const int LEN = 4098;
//返回属于[p,q)的随机整数
int rand(int p, int q)
{
   int size = q-p+1;
   return p+ rand()%size;
}
//交换两个元素值
void swap(int& a , int& b)
{
   int temp = a;
   a = b;
   b = temp;
}
//打印数组值
void print(int *v, int n)
{
    for(int i=0; i < n ; i++)
    {
        printf("%u\n", v[i]);
    }
}
//给数组a[n], 随机不重复赋值[1,n]之间的数
void randomize(int *v, int n)
{
    //initialize
    for(int i=0; i < n; i++)
    {
        v[i] = i+1;
    }
    for(int i=n-1; i>0; i--)
    {
        int r = rand(0,i+1);
        swap(v[r], v[i]);
    }
}
//删除换行符
int chomp(char *str)
{
  int len = strlen(str);
  while(len > 0 && (str[len - 1] == '\n' || str[len - 1] == '\r'))
  {
    str[len - 1] = 0;
    len--;
  }
  return len;
}
//主函数
int main(int argc, char *argv[])
{
    int line_num = atoi(argv[1]);
    printf("%u\n",line_num);
    int *value = (int*)malloc((line_num) * sizeof(int));
    printf("%u\n",line_num);
    randomize(value, line_num);
    //print(value, N);
    FILE* infile = fopen(argv[2], "r");
    if( infile == NULL )
    {
        printf("Cann't open file %s.", argv[1]);
        return 0;
    }
    FILE* outfile = fopen(argv[3], "w");
    if( outfile == NULL)
    {
        printf("Cann't open file %s to write.", argv[2]);
        return 0;
    }
    int i=0;
    char str[LEN];
    str[0] = 0;
    str[LEN-1] = 0;
    while( !feof(infile) )
    {
        if( !fgets(str, sizeof(str),infile))
        {
            break;
        }
        str[LEN- 1] = 0;
        chomp(str);
        fprintf(outfile, "%s\t%u\n", str, value[i]);
        i++;
    }
    fclose(infile);
    fclose(outfile);
    return 0;
}

希望本文所述对大家C语言程序设计有所帮助。

(0)

相关推荐

  • 使用C语言解决字符串全排列问题

    问题 输入一个字符串,打印出该字符串中字符的所有排列.例如输入字符串abc,则输出由字符a,b,c所能排列出来的所有字符串abc,acb,bac,bca,cab和cba 思路 这是典型的递归求解问题,递归算法有四个特性: 必须有可达到的终止条件,否则程序陷入死循环 子问题在规模上比原问题小 子问题可通过再次递归调用求解 子问题的解应能组合成整个问题的解 对于字符串的排列问题: 如果能生成n-1个元素的全排列,就能生成n个元素的全排列.对于只有一个元素的集合,可以直接生成全排列.所以全排列的递归终

  • c语言中 基于随机函数的使用详解

    在C语言中,rand()函数可以用来产生随机数,但是这不是真真意义上的随机数,是一个伪随机数,是根据一个数,我们可以称它为种子,为基准以某个递推公式推算出来的一系数,当这系列数很大的时候,就符合正态公布,从而相当于产生了随机数,但这不是真正的随机数,当计算机正常开机后,这个种子的值是定了的,除非你破坏了系统,为了改变这个种子的值,C提供了srand()函数,它的原形是void srand( int a). 可能大家都知道C语言中的随机函数random,可是random函数并不是ANSI C标准,

  • c语言生成随机数的方法(获得一组不同的随机数)

    复制代码 代码如下: //以空间换时间/*arr :数组名n  :给定的数组长度转移数组中的数据*/ void diffarr(int arr[],int n){    int sn=n,index,*ptr=arr;    int *pfrom=new int[sn];    for(int i=0;i<sn;i++)        *(pfrom+i) =i+1 ;    srand(time(0));    for(int k=0;k<sn;)    {        index=ran

  • C语言/C++如何生成随机数

    本文分享了C语言/C++如何生成随机数的具体实现方法,供大家参考,具体内容如下 C语言/C++怎样产生随机数:这里要用到的是rand()函数, srand()函数,C语言/C++里没有自带的random(int number)函数. (1) 如果你只要产生随机数而不需要设定范围的话,你只要用rand()就可以了:rand()会返回一随机数值, 范围在0至RAND_MAX 间.RAND_MAX定义在stdlib.h, 其值为2147483647. 例如: #include<stdio.h> #i

  • c语言生成随机uuid编码示例

    c语言生成随机uuid编码 复制代码 代码如下: #include <stdio.h>#include <stdlib.h> /** * Create random UUID * * @param buf - buffer to be filled with the uuid string */char *random_uuid( char buf[37] ){    const char *c = "89ab";    char *p = buf;    in

  • C语言实现的排列组合问题的通用算法、解决方法

    尽管排列组合是生活中经常遇到的问题,可在程序设计时,不深入思考或者经验不足都让人无从下手.由于排列组合问题总是先取组合再排列,并且单纯的排列问题相对简单,所以本文仅对组合问题的实现进行详细讨论.以在n个数中选取m(0<m<=n)个数为例,问题可分解为: 1. 首先从n个数中选取编号最大的数,然后在剩下的n-1个数里面选取m-1个数,直到从n-(m-1)个数中选取1个数为止. 2. 从n个数中选取编号次小的一个数,继续执行1步,直到当前可选编号最大的数为m. 很明显,上述方法是一个递归的过程,也

  • 排列和组合算法的实现方法_C语言经典案例

    排列和组合算法是考查递归的常见算法,这两种算法能用递归简洁地实现. 本人在经过多次摸索和思考之后,总结如下,以供参考. 程序代码如下: #include <stdio.h> #include <stdlib.h> char array[] = "abcd"; #define N 4 #define M 3 int queue[N] = {0}; int top = 0; int flag[N] = {0}; void perm(int s, int n) { i

  • C语言实现输入一个字符串后打印出该字符串中字符的所有排列

    本文实例讲述了C语言实现输入一个字符串后打印出该字符串中字符的所有排列的方法,属于数学里的排列问题.是一个很实用的算法技巧.分享给大家供大家参考.具体实现方法如下: 例如输入字符串abc,则输出由字符a.b.c所能排列出来的所有字符串abc.acb.bac.bca.cab和cba. C语言实现代码如下: /* * Copyright (c) 2011 alexingcool. All Rights Reserved. */ #include <iostream> #include <al

  • C语言中用于产生随机数的函数使用方法总结

    在UNIX操作系统和window的操作系统上,我们知道有一个函数rand,它就是用来产生随机数的函数API接口,那么它的原理如何实现? 如果约定a1=f(seed),an+1=f(an),那么可以得到一个序列a1,a2,a3..an,那么要制作一个伪随机函数rand,只需要让它每调用一次就返回序列的下一个元素就行.其实就是相当于第1次调用rand返回a1,第2次返回a2,-,第n次返回an,这样每次返回的数值都不一样,也就是相当于随机数了.但是其实不是真正的随机数,真正的随机数是使用物理现象产生

  • C语言/C++中如何产生随机数

    C语言/C++怎样产生随机数:这里要用到的是rand()函数, srand()函数,和time()函数. 需要说明的是,iostream头文件中就有srand函数的定义,不需要再额外引入stdlib.h;而使用time()函数需要引入ctime头文件. 使用rand()函数获取一个随机数如果你只要产生随机数而不需要设定范围的话,你只要用rand()就可以了:rand()会返回一随机数值, 范围在0至RAND_MAX 间.RAND_MAX定义在stdlib.h, 其值为2147483647. 例子

随机推荐