Tag: 数据挖掘

如何在使用C语言的文件中操作时提高性能

我已经在410k行的大型数据集上实现了朴素贝叶斯算法。现在我的所有记录都被正确分类,但事情是程序花了差不多一小时将记录写入相应的文件。什么是改进的最佳方法我的代码的性能。这是下面的代码。这段代码是将410k记录写入相应的文件。谢谢。 fp=fopen(“sales_ok_fraud.txt”,”r”); while(fgets(line,80,fp)!=NULL) //Reading each line from file to calculate the file size. { token = strtok(line,”,”); token = strtok(NULL,”,”); token = strtok(NULL,”,”); token = strtok(NULL,”,”); token = strtok(NULL,”,”); token = strtok(NULL,”,”); token1 = strtok(token,”\n”); memcpy(mystr,&token1[0],strlen(token1)-1); mystr[strlen(token1)-1] = ‘\0’; if( strcmp(mystr,”ok”) == 0 ) counter_ok++; else counter_fraud++; } printf(“The no. of records with OK label […]