Tag: 统计

虚拟文件的文件大小

我正在使用FUSE创建一个覆盖文件系统,其中目录使用虚拟实体进行扩充。 我将这些实体的文件大小设置为0,因为我无法知道 – 在阅读它们之前,这在我的情况下特别昂贵 – 应该是什么。 但是,似乎有一个明显的优化发生,因为零长度文件不会产生任何read调用(仅open和release )。 因此,我的问题很简单,我应该将文件大小设置为什么? 我知道符号链接的文件名大小; 如果它不是符号链接,这会工作吗? 否则,我能做的最好的事情就是为大小提供一个下限…如果read有一个文件描述符,块大小和偏移量,可能它会读取’直到EOF而不是任何stat可以告诉它。

如何在档案文件中打印文件名?

我是C和系统编程的新手。 我想打开一个存档文件并打印出存档文件中文件的名称(例如,我的存档文件是weds.a;在weds.a中,我有thurs.txt和fri.txt“。我想创建显示thurs.txt fri.txt的输出 编辑:它应该像ar -t命令一样工作。 有人可以给我一些如何做的提示吗? 我一直在阅读手册页并在线查找示例,但我没有在哪里。 我相信我错过了一些东西。 我下面的代码只打印链接计数。 有人可以帮忙吗? 在此先感谢您的帮助!! #include #include #include #include #include #include #include #include #include #include int main (int argc, char **argv) { int in_fd; struct stat sb; if (argc != 2) { printf(“Error”, argv[0]); exit(EXIT_FAILURE); } if (stat(argv[1], &sb) == -1) { perror(“stat”); exit(EXIT_FAILURE); //change from EXIT_SUCCESS to EXIT_FAILURE […]

用二阶二次曲线平滑小数据集

我正在做一些特定的信号分析,我需要一种能够消除给定钟形分布曲线的方法。 运行平均方法不能产生我想要的结果。 我想保持最小/最大,并保持拟合曲线的一般形状,但要解决采样中的不一致问题。 简而言之:如果给出一组模拟简单二次曲线的数据,您会推荐哪种统计平滑方法? 如果可能,请参考实现,库或框架。 谢谢! 编辑 :一些有用的数据 (可能的信号图) alt text http://sofzh.miximages.com/c%2B%2B/b49942.png 深色二次曲线是浅色连接数据点的“拟合”曲线。 样本@ -44(约),是我的图中的一个问题(即潜在的样本不一致)。 我需要这条曲线更好地“适应”分布,并克服不相应趋势的值。 希望这可以帮助!

在C中避免使用置换(nPr,nCr)函数的整数溢出

我试图做一些与统计相关的function,所以我可以执行一些相关的程序(即:概率的统计计算,生成任意深度的Pascal三角形等)。 我遇到了一个问题,我可能会遇到溢出问题。 例如,如果我想计算nPr(n = 30,p = 1),我知道我可以将它减少到: 30P1 = 30! / (30 – 1)! = 30! / (29)! = 30! / 29! = 30 但是,在使用下面的函数进行计算时,由于整数溢出,我看起来总是会得到无效值。 是否有任何变通方法不需要使用库来支持任意大数字? 我已经在其他关于伽玛函数的post中读过一些内容,但找不到具体的例子。 int factorial(int n) { return (n == 1 || n == 0) ? 1 : factorial(n – 1) * n; } int nCr(int n, int r) { return […]

程序统计工具

是否有一个工具能够解析我的源代码(fortran,C或C ++)并返回统计信息,如循环次数,平均循环大小,函数数量,函数调用次数,数量,大小和数组类型,变量等? 类似的东西,在我的架构上不易运行

自动比较两个系列 – 相似性测试

我有两个系列,series1和series2。 我的目标是自动/定量地找出Series2与Series1的不同之处,在bin到bin的基础上 (每个bin代表一个特定的特征)。 单击此处可以看到此图像的原始大小。 Series1是预期的结果。 Series2是测试/传入系列。 我提供了直方图,其中Series2以深棕色表示。 您还可以在221和353之间的x轴上注意到有显着的变化。 即Series2小于Series1。 我正在使用C ++进行编码。 我认为,互相关会有所帮助,但会产生一个基于相似性而非不相似性的价值。 我看到人们谈论Kolmogorov-Smirnov测试。 这是我应该进行的测试吗? 更新1:我正在尝试执行模板匹配。 我已将模板图像分成8×8块以及我的传入测试图像。 我试图将模板图像中的一个块与测试图像中的相同块(基于空间像素位置)进行比较。 我计算每个块内的强度和。我获得了模板图像的series1,并且测试图像具有Seri​​es2。

偏最小二乘图书馆

已经有这样的问题,但没有回答,所以我试着再次发布。 有谁知道在C ++(或C)中使用偏最小二乘算法的开源实现? 或者也许是图书馆呢?

在C中生成INTEGERS的均匀分布

我编写了一个C函数,我认为从范围[rangeLow,rangeHigh](包括范围)的均匀分布中选择整数 。 这不是家庭作业 – 我只是在一些嵌入式系统中使用它来修补我正在做的事情。 在我的测试用例中,此代码似乎产生了适当的分布。 但是,我并不完全相信实施是正确的。 如果我在这里做错了什么,有人可以做一次健全检查并让我知道吗? //uniform_distribution returns an INTEGER in [rangeLow, rangeHigh], inclusive. int uniform_distribution(int rangeLow, int rangeHigh) { int myRand = (int)rand(); int range = rangeHigh – rangeLow + 1; //+1 makes it [rangeLow, rangeHigh], inclusive. int myRand_scaled = (myRand % range) + rangeLow; return myRand_scaled; } //note: make sure rand() […]