在Haskell和C之间交换结构化数据

首先,我是Haskell的初学者。

我正计划将Haskell集成到C中用于实时游戏。 Haskell做逻辑,C做渲染。 要做到这一点,我必须为每个滴答(每秒至少30次)从彼此传递巨大的复杂结构数据(游戏状态)。 所以传递的数据应该是轻量级的。 该状态数据可以放在存储器上的顺序空间上。 Haskell和C部分都应该自由地访问各州的每个区域。

在最好的情况下,传递数据的成本可以是复制指向内存的指针。 在最坏的情况下,通过转换复制整个数据。

我正在阅读Haskell的FFI( http://www.haskell.org/haskellwiki/FFICookBook#Working_with_structs )Haskell代码看起来明确指定了内存布局。

我有几个问题。

  1. Haskell可以明确指定内存布局吗? (与C结构完全匹配)
  2. 这是真正的内存布局吗? 或者需要任何类型的转换? (性能损失)
  3. 如果Q#2为真,那么当显式指定内存布局时会有任何性能损失吗?
  4. #{alignment foo}的语法是什么? 我在哪里可以找到关于此的文件?
  5. 如果我想以最佳性能传递大量数据,我该怎么做?

* PS显式内存布局function,我说只是C#的[StructLayout]属性。 这是明确指定内存中位置和大小的。 http://www.developerfusion.com/article/84519/mastering-structs-in-c/

我不确定Haskell是否具有与C struct字段匹配的语言结构。

我强烈建议使用预处理器。 我喜欢c2hs,但是hsc2hs很常见,因为它包含在ghc中。 Greencard似乎被放弃了。

回答你的问题:

1)是的,通过可存储实例的定义。 使用Storable是通过FFI传递数据的唯一安全机制。 Storable实例定义了如何在Haskell类型和原始内存(Haskell Ptr,ForeignPtr或StablePtr或C指针)之间编组数据。 这是一个例子:

 data PlateC = PlateC { numX :: Int, numY :: Int, v1 :: Double, v2 :: Double } deriving (Eq, Show) instance Storable PlateC where alignment _ = alignment (undefined :: CDouble) sizeOf _ = {#sizeof PlateC#} peek p = PlateC <$> fmap fI ({#get PlateC.numX #} p) <*> fmap fI ({#get PlateC.numY #} p) <*> fmap realToFrac ({#get PlateC.v1 #} p) <*> fmap realToFrac ({#get PlateC.v2 #} p) poke p (PlateC xv yv v1v v2v) = do {#set PlateC.numX #} p (fI xv) {#set PlateC.numY #} p (fI yv) {#set PlateC.v1 #} p (realToFrac v1v) {#set PlateC.v2 #} p (realToFrac v2v) 

{# ... #}片段是c2hs代码。 fI 。 get和set片段中的值从包含的头引用以下结构,而不是同名的Haskell类型:

 struct PlateCTag ; typedef struct PlateCTag { int numX; int numY; double v1; double v2; } PlateC ; 

c2hs将其转换为以下普通Haskell:

 instance Storable PlateC where alignment _ = alignment (undefined :: CDouble) sizeOf _ = 24 peek p = PlateC <$> fmap fI ((\ptr -> do {peekByteOff ptr 0 ::IO CInt}) p) <*> fmap fI ((\ptr -> do {peekByteOff ptr 4 ::IO CInt}) p) <*> fmap realToFrac ((\ptr -> do {peekByteOff ptr 8 ::IO CDouble}) p) <*> fmap realToFrac ((\ptr -> do {peekByteOff ptr 16 ::IO CDouble}) p) poke p (PlateC xv yv v1v v2v) = do (\ptr val -> do {pokeByteOff ptr 0 (val::CInt)}) p (fI xv) (\ptr val -> do {pokeByteOff ptr 4 (val::CInt)}) p (fI yv) (\ptr val -> do {pokeByteOff ptr 8 (val::CDouble)}) p (realToFrac v1v) (\ptr val -> do {pokeByteOff ptr 16 (val::CDouble)}) p (realToFrac v2v) 

偏移当然是与体系结构相关的,因此使用预处理器可以编写可移植代码。

您可以通过为数据类型( newmalloc等)分配空间并将数据戳入Ptr(或ForeignPtr)来使用它。

2)这是真正的内存布局。

3)用peek / poke读/写是一种惩罚。 如果您有大量数据,最好只转换您需要的数据,例如从C数组中只读取一个元素,而不是将整个数组编组到Haskell列表中。

4)语法取决于您选择的预处理器。 c2hs docs 。 hsc2hs文档 。 令人困惑的是,hsc2​​hs使用语法#stuff#{stuff} ,而c2hs使用{#stuff #}

5)@sclv的建议也是我要做的。 编写一个可存储的实例并保留指向数据的指针。 您可以编写C函数来完成所有工作并通过FFI调用它们,或者(不太好)使用peek和poke编写低级Haskell来操作所需的数据部分。 整齐地来回编组整个事物(即在整个数据结构上调用peekpoke )将是昂贵的,但如果你只传递指针,成本将是最小的。

通过FFI调用导入的函数会受到重大惩罚,除非它们被标记为“不安全”。 声明导入“不安全”意味着该函数不应回调到Haskell或未定义的行为结果。 如果你使用并发或并行,它也意味着相同function(即CPU)上的所有Haskell线程将阻塞,直到调用返回,因此它应该相当快地返回。 如果这些条件可以接受,则“不安全”呼叫相对较快。

Hackage上有很多软件包来处理这类事情。 我可以推荐hsndfile和hCsound作为c2hs的良好实践。 如果你看一下你熟悉的小型C库的绑定可能会更容易。

即使你可以获得严格的无盒装Haskell结构的确定性内存布局,但是没有任何保证,这是一个非常糟糕的主意。

如果您愿意接受转换,可以使用Storeable: http : //www.haskell.org/ghc/docs/6.12.3/html/libraries/base-4.2.0.2/Foreign-Storable.html

我要做的是构造C结构,然后使用FFI构造直接在它们上运行的Haskell函数,而不是试图为它们生成Haskell“等价物”。

或者,您可以决定只需要将选择的信息传递给C – 而不是整个游戏状态,而只是关于世界上哪些对象的一些信息,以及您的实际信息如何吸引他们只生活在等式的C面。 然后,您在Haskell中执行所有逻辑,在本机Haskell结构上运行,并且仅向C世界投射C实际需要呈现的微小数据子集。

编辑:我应该补充说,矩阵和其他常见的c结构已经有很好的库/绑定,可以保持c侧的繁重。

hsc2hs , c→hs和Green Card都提供自动Haskell⇆C结构查看/戳或编组。 我建议他们使用手动确定大小和偏移量以及在Haskell中使用指针操作,尽管这也是可能的。

  1. 如果我理解你的话,据我所知。 Haskell没有任何内置的外部聚合数据结构处理。
  2. 正如那个页面描述的那样,它是带有一些C魔法的hsc2hs