swprintf在8位范围之外的字符上扼流圈
这发生在OS X上,但我怀疑它适用于任何UNIX-y操作系统。 我有两个字符串,如下所示:
const wchar_t * test1 =(const wchar_t *)“\ x44 \ x00 \ x00 \ x00 \ x73 \ x00 \ x00 \ x00 \ x00 \ x00 \ x00 \ x00”; const wchar_t * test2 =(const wchar_t *)“\ x44 \ x00 \ x00 \ x00 \ x19 \ x20 \ x00 \ x00 \ x73 \ x00 \ x00 \ x00 \ x00 \ x00 \ x00 \ x00”;
在调试器中,test1看起来像“Ds”,test2看起来像“D’s”(带有撇号)。 然后我调用这段代码:
wchar_t buf1 [100],buf2 [100]; int ret1 = swprintf(buf1,100,L“%ls”,test1); int ret2 = swprintf(buf2,100,L“%ls”,test2);
第一个swprintf调用工作正常。 第二个返回-1(缓冲区不变)。
我猜这个问题与locales有关,但谷歌搜索并没有提供任何有用的东西。 这是重现我所看到的问题的最简单方法。 我真正感兴趣的是vswprintf(),但我认为这是密切相关的。
为什么swprintf会阻塞8位范围之外的unicode字符? 反正有解决这个问题吗?
尝试将语言环境明确设置为UTF-8。
setlocale(LC_CTYPE, "UTF-8"); ... const wchar_t* test2 = L"D\x2019s"; int ret2 = swprintf(buf2, 100, L"%ls", test2); ...