Tag: podofo

使用PoDoFo lib从PDF运算符中的数组TJ中提取文本

我正在尝试使用PoDoFo库从PDF文件中提取文本,它正在为Tj运算符工作,并且无法为(数组) TJ运算符执行此操作。 我在这里找到了这段代码(我的小修改): const char* pszToken = NULL; PdfVariant var; EPdfContentsType eType; PdfContentsTokenizer tokenizer( pPage ); double dCurPosX = 0.0; double dCurPosY = 0.0; double dCurFontSize = 0.0; bool bTextBlock = false; PdfFont* pCurFont = NULL; std::stack stack; while( tokenizer.ReadNext( eType, pszToken, var ) ) { if( eType == ePdfContentsType_Keyword ) { // support ‘l’ […]