用于群集的C / C ++机器学习库

什么是支持多维数据聚类的C / c ++机器学习库? (例如K-Means)

到目前为止,我遇到过

  • SGI MLC ++ http://www.sgi.com/tech/mlc/
  • OpenCV MLL

我很想推出自己的产品,但我确信预先存在的产品可以通过更多关注代码来优化性能。

来自东京大学人类基因组团队的开源C聚类库看起来很有希望。 它具有K-means以及其他平面分层聚类算法。 在没有GUI的裸库中向下滚动页面。 Wikipedia-Clustering项目看起来不错,而且更轻松。 这是马里兰大学的专业K-means图书馆 。 我建议你考虑一下你的数据类型。 预处理数据以创建特征向量可能具有挑战性。

我不确定你是否在寻找C4.5,ID3等算法。 如果您这样做,您可以从他们正在积极研究的大学网站下载各个来源。

例如:C4.5来源可以在Quinlan的网站上找到。