qutfcodec.cpp

Jenkins

qutfcodec.cpp

Absolute File Name:

/home/qt/qt5_coco/qt5/qtbase/src/corelib/codecs/qutfcodec.cpp

Line

Source

Count

/****************************************************************************

** Contact: https://www.qt.io/licensing/

** This file is part of the QtCore module of the Qt Toolkit.

** $QT_BEGIN_LICENSE:LGPL$

** Commercial License Usage

** Licensees holding valid commercial Qt licenses may use this file in

** accordance with the commercial license agreement provided with the

** Software or, alternatively, in accordance with the terms contained in

** a written agreement between you and The Qt Company. For licensing terms

** and conditions see https://www.qt.io/terms-conditions. For further

** information use the contact form at https://www.qt.io/contact-us.

** GNU Lesser General Public License Usage

** Alternatively, this file may be used under the terms of the GNU Lesser

** General Public License version 3 as published by the Free Software

** Foundation and appearing in the file LICENSE.LGPL3 included in the

** packaging of this file. Please review the following information to

** ensure the GNU Lesser General Public License version 3 requirements

** will be met: https://www.gnu.org/licenses/lgpl-3.0.html.

** GNU General Public License Usage

** Alternatively, this file may be used under the terms of the GNU

** General Public License version 2.0 or (at your option) the GNU General

** Public license version 3 or any later version approved by the KDE Free

** Qt Foundation. The licenses are as published by the Free Software

** Foundation and appearing in the file LICENSE.GPL2 and LICENSE.GPL3

** included in the packaging of this file. Please review the following

** information to ensure the GNU General Public License requirements will

** be met: https://www.gnu.org/licenses/gpl-2.0.html and

** https://www.gnu.org/licenses/gpl-3.0.html.

** $QT_END_LICENSE$

****************************************************************************/

#include "qutfcodec_p.h"

#include "qlist.h"

#include "qendian.h"

#include "qchar.h"

#include "private/qsimd_p.h"

#include "private/qstringiterator_p.h"

QT_BEGIN_NAMESPACE

enum { Endian = 0, Data = 1 };

static const uchar utf8bom[] = { 0xef, 0xbb, 0xbf };

#if defined(__SSE2__) && defined(QT_COMPILER_SUPPORTS_SSE2)

static inline bool simdEncodeAscii(uchar *&dst, const ushort *&nextAscii, const ushort *&src, const ushort *end)

{

// do sixteen characters at a time

for ( ; end - src >= 16; src += 16, dst += 16) {

__m128i data1 = _mm_loadu_si128((const __m128i*)src);

__m128i data2 = _mm_loadu_si128(1+(const __m128i*)src);

// check if everything is ASCII

// the highest ASCII value is U+007F

// Do the packing directly:

// The PACKUSWB instruction has packs a signed 16-bit integer to an unsigned 8-bit

// with saturation. That is, anything from 0x0100 to 0x7fff is saturated to 0xff,

// while all negatives (0x8000 to 0xffff) get saturated to 0x00. To detect non-ASCII,

// we simply do a signed greater-than comparison to 0x00. That means we detect NULs as

// "non-ASCII", but it's an acceptable compromise.

__m128i packed = _mm_packus_epi16(data1, data2);

__m128i nonAscii = _mm_cmpgt_epi8(packed, _mm_setzero_si128());

// store, even if there are non-ASCII characters here

_mm_storeu_si128((__m128i*)dst, packed);

// n will contain 1 bit set per character in [data1, data2] that is non-ASCII (or NUL)

ushort n = ~_mm_movemask_epi8(nonAscii);

if (n) {

// find the next probable ASCII character

// we don't want to load 32 bytes again in this loop if we know there are non-ASCII

// characters still coming

nextAscii = src + _bit_scan_reverse(n) + 1;

n = _bit_scan_forward(n);

dst += n;

src += n;

return false;

}

return src == end;

}

static inline bool simdDecodeAscii(ushort *&dst, const uchar *&nextAscii, const uchar *&src, const uchar *end)

{

// do sixteen characters at a time

for ( ; end - src >= 16; src += 16, dst += 16) {

__m128i data = _mm_loadu_si128((const __m128i*)src);

100

101

#ifdef __AVX2__

102

const int BitSpacing = 2;

103

// load and zero extend to an YMM register

104

const __m256i extended = _mm256_cvtepu8_epi16(data);

105

106

uint n = _mm256_movemask_epi8(extended);

107

if (!n) {

108

// store

109

_mm256_storeu_si256((__m256i*)dst, extended);

continue;

}

#else

const int BitSpacing = 1;

114

115

// check if everything is ASCII

116

// movemask extracts the high bit of every byte, so n is non-zero if something isn't ASCII

117

uint n = _mm_movemask_epi8(data);

118

if (!n) {

119

// unpack

120

_mm_storeu_si128((__m128i*)dst, _mm_unpacklo_epi8(data, _mm_setzero_si128()));

121

_mm_storeu_si128(1+(__m128i*)dst, _mm_unpackhi_epi8(data, _mm_setzero_si128()));

continue;

}

#endif

// copy the front part that is still ASCII

while (!(n & 1)) {

*dst++ = *src++;

n >>= BitSpacing;

}

// find the next probable ASCII character

133

// we don't want to load 16 bytes again in this loop if we know there are non-ASCII

134

// characters still coming

135

n = _bit_scan_reverse(n);

136

nextAscii = src + (n / BitSpacing) + 1;

return false;

}

return src == end;

}

#else

static inline bool simdEncodeAscii(uchar *, const ushort *, const ushort *, const ushort *)

{

return false;

}

static inline bool simdDecodeAscii(ushort *, const uchar *, const uchar *, const uchar *)

{

return false;

}

#endif

QByteArray QUtf8::convertFromUnicode(const QChar *uc, int len)

155

{

156

// create a QByteArray with the worst case scenario size

157

QByteArray result(len * 3, Qt::Uninitialized);

158

uchar *dst = reinterpret_cast<uchar *>(const_cast<char *>(result.constData()));

159

const ushort *src = reinterpret_cast<const ushort *>(uc);

160

const ushort *const end = src + len;

161

162

while (src != end) {

163

const ushort *nextAscii = end;

164

if (simdEncodeAscii(dst, nextAscii, src, end))

break;

do {

ushort uc = *src++;

int res = QUtf8Functions::toUtf8<QUtf8BaseTraits>(uc, dst, src, end);

170

if (res < 0) {

171

// encoding error - append '?'

172

*dst++ = '?';

173

}

174

} while (src < nextAscii);

175

}

176

177

result.truncate(dst - reinterpret_cast<uchar *>(const_cast<char *>(result.constData())));

return result;

}

QByteArray QUtf8::convertFromUnicode(const QChar *uc, int len, QTextCodec::ConverterState *state)

182

{

183

uchar replacement = '?';

184

int rlen = 3*len;

185

int surrogate_high = -1;

186

if (state) {

187

if (state->flags & QTextCodec::ConvertInvalidToNull)

188

replacement = 0;

189

if (!(state->flags & QTextCodec::IgnoreHeader))

190

rlen += 3;

191

if (state->remainingChars)

192

surrogate_high = state->state_data[0];

}

QByteArray rstr(rlen, Qt::Uninitialized);

197

uchar *cursor = reinterpret_cast<uchar *>(const_cast<char *>(rstr.constData()));

198

const ushort *src = reinterpret_cast<const ushort *>(uc);

199

const ushort *const end = src + len;

200

201

int invalid = 0;

202

if (state && !(state->flags & QTextCodec::IgnoreHeader)) {

203

// append UTF-8 BOM

204

*cursor++ = utf8bom[0];

205

*cursor++ = utf8bom[1];

206

*cursor++ = utf8bom[2];

207

}

208

209

const ushort *nextAscii = src;

while (src != end) {

int res;

ushort uc;

if (surrogate_high != -1) {

214

uc = surrogate_high;

215

surrogate_high = -1;

216

res = QUtf8Functions::toUtf8<QUtf8BaseTraits>(uc, cursor, src, end);

217

} else {

218

if (src >= nextAscii && simdEncodeAscii(cursor, nextAscii, src, end))

break;

uc = *src++;

res = QUtf8Functions::toUtf8<QUtf8BaseTraits>(uc, cursor, src, end);

223

}

224

if (Q_LIKELY(res >= 0))

225

continue;

226

227

if (res == QUtf8BaseTraits::Error) {

228

// encoding error

229

++invalid;

230

*cursor++ = replacement;

231

} else if (res == QUtf8BaseTraits::EndOfString) {

surrogate_high = uc;

break;

}

}

rstr.resize(cursor - (const uchar*)rstr.constData());

238

if (state) {

239

state->invalidChars += invalid;

240

state->flags |= QTextCodec::IgnoreHeader;

241

state->remainingChars = 0;

242

if (surrogate_high >= 0) {

243

state->remainingChars = 1;

244

state->state_data[0] = surrogate_high;

}

}

return rstr;

}

QString QUtf8::convertToUnicode(const char *chars, int len)

251

{

252

// UTF-8 to UTF-16 always needs the exact same number of words or less:

// UTF-8 UTF-16

// 1 byte 1 word

// 2 bytes 1 word

// 3 bytes 1 word

// 4 bytes 2 words (one surrogate pair)

258

// That is, we'll use the full buffer if the input is US-ASCII (1-byte UTF-8),

259

// half the buffer for U+0080-U+07FF text (e.g., Greek, Cyrillic, Arabic) or

260

// non-BMP text, and one third of the buffer for U+0800-U+FFFF text (e.g, CJK).

261

262

// The table holds for invalid sequences too: we'll insert one replacement char

263

// per invalid byte.

264

QString result(len, Qt::Uninitialized);

265

ushortQChar *dstdata = reinterpret_cast<ushort *>(const_cast<QChar*>(result.constData()));()); // we know we're not shared

266

const QChar *end = convertToUnicode(data, chars, len);

267

result.truncate(end - data);

268

return result;

executed 3930821 times by 532 tests: return result;

Executed by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QApplication
tst_QAsn1Element
...

3930821

}

/*!

\since 5.7

\overload

Converts the UTF-8 sequence of \a len octets beginning at \a chars to

276

a sequence of QChar starting at \a buffer. The buffer is expected to be

277

large enough to hold the result. An upper bound for the size of the

278

buffer is \a len QChars.

279

280

If, during decoding, an error occurs, a QChar::ReplacementCharacter is

281

written.

282

283

Returns a pointer to one past the last QChar written.

284

285

This function never throws.

286

287

288

QChar *QUtf8::convertToUnicode(QChar *buffer, const char *chars, int len) Q_DECL_NOTHROW

289

{

290

ushort *dst = reinterpret_cast<ushort *>(buffer);

291

const uchar *src = reinterpret_cast<const uchar *>(chars);

292

const uchar *end = src + len;

293

294

// attempt to do a full decoding in SIMD

295

const uchar *nextAscii = end;

296

if (!simdDecodeAscii(dst, nextAscii, src, end)) {

!simdDecodeAsc...cii, src, end)

Description

TRUE

evaluated 4015432 times by 546 tests

Evaluated by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QAnimationGroup
tst_QApplication
...

FALSE

evaluated 598854 times by 300 tests

Evaluated by:

tst_Collections
tst_LargeFile
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QAlgorithms
tst_QApplication
tst_QAuthenticator
tst_QBitArray
tst_QBoxLayout
tst_QBuffer
tst_QButtonGroup
tst_QByteArray
tst_QCalendarWidget
tst_QCheckBox
tst_QColor
tst_QColorDialog
tst_QColumnView
...

598854-4015432

297

// at least one non-ASCII entry

298

// check if we failed to decode the UTF-8 BOM; if so, skip it

299

if (Q_UNLIKELY(src == reinterpret_cast<const uchar *>(chars))

__builtin_expe...hars)), false)

Description

TRUE

evaluated 3479490 times by 518 tests

Evaluated by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QApplication
tst_QArrayData
...

FALSE

evaluated 535942 times by 497 tests

Evaluated by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAnimationGroup
tst_QApplication
tst_QArrayData
tst_QArrayData_StrictIterators
tst_QAuthenticator
...

535942-3479490

300

&& end - src >= 3

end - src >= 3

Description

TRUE

evaluated 1873886 times by 389 tests

Evaluated by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QApplication
tst_QAsn1Element
tst_QAuthenticator
...

FALSE

evaluated 1605604 times by 445 tests

Evaluated by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QApplication
tst_QArrayData
tst_QArrayData_StrictIterators
tst_QBackingStore
...

1605604-1873886

301

&& Q_UNLIKELY(src[0] == utf8bom[0] && src[1] == utf8bom[1] && src[2] == utf8bom[2])) {

__builtin_expe...om[2]), false)

Description

TRUE

evaluated 5 times by 2 tests

Evaluated by:

tst_QString
tst_QUrlInternal

FALSE

evaluated 1873881 times by 389 tests

Evaluated by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QApplication
tst_QAsn1Element
tst_QAuthenticator
...

5-1873881

302

src += 3;

303

}

executed 5 times by 2 tests: end of block

Executed by:

tst_QString
tst_QUrlInternal

304

305

while (src < end) {

src < end

Description

TRUE

evaluated 4064914 times by 546 tests

Evaluated by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QAnimationGroup
tst_QApplication
...

FALSE

evaluated 4015424 times by 546 tests

Evaluated by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QAnimationGroup
tst_QApplication
...

4015424-4064914

306

nextAscii = end;

307

if (simdDecodeAscii(dst, nextAscii, src, end))

simdDecodeAsci...cii, src, end)

Description

TRUE

evaluated 8 times by 1 test

Evaluated by:

tst_QComplexText

FALSE

evaluated 4064906 times by 546 tests

Evaluated by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QAnimationGroup
tst_QApplication
...

8-4064906

308

break;

executed 8 times by 1 test: break;

Executed by:

tst_QComplexText

do {

uchar b = *src++;

int res = QUtf8Functions::fromUtf8<QUtf8BaseTraits>(b, dst, src, end);

313

if (res < 0) {

res < 0

Description

TRUE

evaluated 530 times by 5 tests

Evaluated by:

tst_QString
tst_QTextCodec
tst_QTextStream
tst_QUrlInternal
tst_QXmlSimpleReader

FALSE

evaluated 17941153 times by 546 tests

Evaluated by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QAnimationGroup
tst_QApplication
...

530-17941153

314

// decoding error

315

*dst++ = QChar::ReplacementCharacter;

316

}

executed 530 times by 5 tests: end of block

Executed by:

tst_QString
tst_QTextCodec
tst_QTextStream
tst_QUrlInternal
tst_QXmlSimpleReader

530

317

} while (src < nextAscii);

executed 17941683 times by 546 tests: end of block

Executed by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QAnimationGroup
tst_QApplication
...

src < nextAscii

Description

TRUE

evaluated 13876777 times by 543 tests

Evaluated by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QAnimationGroup
tst_QApplication
...

FALSE

evaluated 4064906 times by 546 tests

Evaluated by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QAnimationGroup
tst_QApplication
...

4064906-17941683

318

}

executed 4064906 times by 546 tests: end of block

Executed by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QAnimationGroup
tst_QApplication
...

4064906

319

}

executed 4015432 times by 546 tests: end of block

Executed by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QAnimationGroup
tst_QApplication
...

4015432

320

321

result.truncate(dst -return reinterpret_cast<const ushortQChar *>(result.constData()));

executed 4614286 times by 546 tests: return reinterpret_cast<QChar *>(dst);

Executed by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QAnimationGroup
tst_QApplication
...

4614286

return result;

executed 4614286 times by 546 tests: return reinterpret_cast<QChar *>(dst);

Executed by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QAnimationGroup
tst_QApplication
...

dst);

executed 4614286 times by 546 tests: return reinterpret_cast<QChar *>(dst);

Executed by:

tst_Collections
tst_Compiler
tst_Gestures
tst_Lancelot
tst_LargeFile
tst_ModelTest
tst_NetworkSelfTest
tst_PlatformSocketEngine
tst_QAbstractButton
tst_QAbstractFileEngine
tst_QAbstractItemModel
tst_QAbstractItemView
tst_QAbstractNetworkCache
tst_QAbstractPrintDialog
tst_QAbstractProxyModel
tst_QAbstractScrollArea
tst_QAbstractSlider
tst_QAbstractSpinBox
tst_QAbstractTextDocumentLayout
tst_QAccessibility
tst_QAction
tst_QActionGroup
tst_QAlgorithms
tst_QAnimationGroup
tst_QApplication
...

322

}

323

324

QString QUtf8::convertToUnicode(const char *chars, int len, QTextCodec::ConverterState *state)

325

{

326

bool headerdone = false;

327

ushort replacement = QChar::ReplacementCharacter;

int invalid = 0;

int res;

uchar ch = 0;

// See above for buffer requirements for stateless decoding. However, that

333

// fails if the state is not empty. The following situations can add to the

334

// requirements:

335

// state contains chars starts with requirement

336

// 1 of 2 bytes valid continuation 0

337

// 2 of 3 bytes same 0

338

// 3 bytes of 4 same +1 (need to insert surrogate pair)

339

// 1 of 2 bytes invalid continuation +1 (need to insert replacement and restart)

340

// 2 of 3 bytes same +1 (same)

341

// 3 of 4 bytes same +1 (same)

342

QString result(len + 1, Qt::Uninitialized);

343

344

ushort *dst = reinterpret_cast<ushort *>(const_cast<QChar *>(result.constData()));

345

const uchar *src = reinterpret_cast<const uchar *>(chars);

346

const uchar *end = src + len;

347

348

if (state) {

349

if (state->flags & QTextCodec::IgnoreHeader)

350

headerdone = true;

351

if (state->flags & QTextCodec::ConvertInvalidToNull)

352

replacement = QChar::Null;

353

if (state->remainingChars) {

354

// handle incoming state first

355

uchar remainingCharsData[4]; // longest UTF-8 sequence possible

356

int remainingCharsCount = state->remainingChars;

357

int newCharsToCopy = qMin<int>(sizeof(remainingCharsData) - remainingCharsCount, end - src);

358

359

memset(remainingCharsData, 0, sizeof(remainingCharsData));

360

memcpy(remainingCharsData, &state->state_data[0], remainingCharsCount);

361

memcpy(remainingCharsData + remainingCharsCount, src, newCharsToCopy);

362

363

const uchar *begin = &remainingCharsData[1];

364

res = QUtf8Functions::fromUtf8<QUtf8BaseTraits>(remainingCharsData[0], dst, begin,

365

static_cast<const uchar *>(remainingCharsData) + remainingCharsCount + newCharsToCopy);

366

if (res == QUtf8BaseTraits::Error || (res == QUtf8BaseTraits::EndOfString && len == 0)) {

367

// special case for len == 0:

368

// if we were supplied an empty string, terminate the previous, unfinished sequence with error

369

++invalid;

370

*dst++ = replacement;

371

} else if (res == QUtf8BaseTraits::EndOfString) {

372

// if we got EndOfString again, then there were too few bytes in src;

373

// copy to our state and return

374

state->remainingChars = remainingCharsCount + newCharsToCopy;

375

memcpy(&state->state_data[0], remainingCharsData, state->remainingChars);

376

return QString();

377

} else if (!headerdone && res >= 0) {

378

// eat the UTF-8 BOM

379

headerdone = true;

380

if (dst[-1] == 0xfeff)

--dst;

}

// adjust src now that we have maybe consumed a few chars

385

if (res >= 0) {

386

Q_ASSERT(res > remainingCharsCount);

387

src += res - remainingCharsCount;

}

}

}

// main body, stateless decoding

393

res = 0;

394

const uchar *nextAscii = src;

395

const uchar *start = src;

396

while (res >= 0 && src < end) {

397

if (src >= nextAscii && simdDecodeAscii(dst, nextAscii, src, end))

break;

ch = *src++;

res = QUtf8Functions::fromUtf8<QUtf8BaseTraits>(ch, dst, src, end);

402

if (!headerdone && res >= 0) {

403

headerdone = true;

404

if (src == start + 3) { // 3 == sizeof(utf8-bom)

405

// eat the UTF-8 BOM (it can only appear at the beginning of the string).

406

if (dst[-1] == 0xfeff)

--dst;

}

}

if (res == QUtf8BaseTraits::Error) {

411

res = 0;

412

++invalid;

413

*dst++ = replacement;

}

}

if (!state && res == QUtf8BaseTraits::EndOfString) {

418

// unterminated UTF sequence

419

*dst++ = QChar::ReplacementCharacter;

420

while (src++ < end)

421

*dst++ = QChar::ReplacementCharacter;

422

}

423

424

result.truncate(dst - (const ushort *)result.unicode());

425

if (state) {

426

state->invalidChars += invalid;

427

if (headerdone)

428

state->flags |= QTextCodec::IgnoreHeader;

429

if (res == QUtf8BaseTraits::EndOfString) {

430

--src; // unread the byte in ch

431

state->remainingChars = end - src;

432

memcpy(&state->state_data[0], src, end - src);

433

} else {

434

state->remainingChars = 0;

}

}

return result;

}

QByteArray QUtf16::convertFromUnicode(const QChar *uc, int len, QTextCodec::ConverterState *state, DataEndianness e)

441

{

442

DataEndianness endian = e;

443

int length = 2*len;

444

if (!state || (!(state->flags & QTextCodec::IgnoreHeader))) {

445

length += 2;

446

}

447

if (e == DetectEndianness) {

448

endian = (QSysInfo::ByteOrder == QSysInfo::BigEndian) ? BigEndianness : LittleEndianness;

}

QByteArray d;

d.resize(length);

char *data = d.data();

454

if (!state || !(state->flags & QTextCodec::IgnoreHeader)) {

455

QChar bom(QChar::ByteOrderMark);

456

if (endian == BigEndianness) {

457

data[0] = bom.row();

458

data[1] = bom.cell();

459

} else {

460

data[0] = bom.cell();

data[1] = bom.row();

}

data += 2;

}

if (endian == BigEndianness) {

466

for (int i = 0; i < len; ++i) {

467

*(data++) = uc[i].row();

468

*(data++) = uc[i].cell();

469

}

470

} else {

471

for (int i = 0; i < len; ++i) {

472

*(data++) = uc[i].cell();

473

*(data++) = uc[i].row();

}

}

if (state) {

state->remainingChars = 0;

479

state->flags |= QTextCodec::IgnoreHeader;

}

return d;

}

QString QUtf16::convertToUnicode(const char *chars, int len, QTextCodec::ConverterState *state, DataEndianness e)

485

{

486

DataEndianness endian = e;

487

bool half = false;

488

uchar buf = 0;

489

bool headerdone = false;

490

if (state) {

491

headerdone = state->flags & QTextCodec::IgnoreHeader;

492

if (endian == DetectEndianness)

493

endian = (DataEndianness)state->state_data[Endian];

494

if (state->remainingChars) {

495

half = true;

496

buf = state->state_data[Data];

497

}

498

}

499

if (headerdone && endian == DetectEndianness)

500

endian = (QSysInfo::ByteOrder == QSysInfo::BigEndian) ? BigEndianness : LittleEndianness;

501

502

QString result(len, Qt::Uninitialized); // worst case

503

QChar *qch = (QChar *)result.data();

while (len--) {

if (half) {

QChar ch;

if (endian == LittleEndianness) {

ch.setRow(*chars++);

ch.setCell(buf);

} else {

ch.setRow(buf);

ch.setCell(*chars++);

}

if (!headerdone) {

headerdone = true;

if (endian == DetectEndianness) {

517

if (ch == QChar::ByteOrderSwapped) {

518

endian = LittleEndianness;

519

} else if (ch == QChar::ByteOrderMark) {

520

endian = BigEndianness;

521

} else {

522

if (QSysInfo::ByteOrder == QSysInfo::BigEndian) {

523

endian = BigEndianness;

524

} else {

525

endian = LittleEndianness;

526

ch = QChar((ch.unicode() >> 8) | ((ch.unicode() & 0xff) << 8));

}

*qch++ = ch;

}

} else if (ch != QChar::ByteOrderMark) {

*qch++ = ch;

}

} else {

*qch++ = ch;

}

half = false;

} else {

buf = *chars++;

half = true;

}

}

result.truncate(qch - result.unicode());

if (state) {

if (headerdone)

state->flags |= QTextCodec::IgnoreHeader;

547

state->state_data[Endian] = endian;

548

if (half) {

549

state->remainingChars = 1;

550

state->state_data[Data] = buf;

551

} else {

552

state->remainingChars = 0;

553

state->state_data[Data] = 0;

}

}

return result;

}

QByteArray QUtf32::convertFromUnicode(const QChar *uc, int len, QTextCodec::ConverterState *state, DataEndianness e)

560

{

561

DataEndianness endian = e;

562

int length = 4*len;

563

if (!state || (!(state->flags & QTextCodec::IgnoreHeader))) {

564

length += 4;

565

}

566

if (e == DetectEndianness) {

567

endian = (QSysInfo::ByteOrder == QSysInfo::BigEndian) ? BigEndianness : LittleEndianness;

568

}

569

570

QByteArray d(length, Qt::Uninitialized);

571

char *data = d.data();

572

if (!state || !(state->flags & QTextCodec::IgnoreHeader)) {

573

if (endian == BigEndianness) {

574

data[0] = 0;

575

data[1] = 0;

576

data[2] = (char)0xfe;

577

data[3] = (char)0xff;

578

} else {

579

data[0] = (char)0xff;

580

data[1] = (char)0xfe;

data[2] = 0;

data[3] = 0;

}

data += 4;

}

QStringIterator i(uc, uc + len);

588

if (endian == BigEndianness) {

589

while (i.hasNext()) {

590

uint cp = i.next();

591

592

*(data++) = cp >> 24;

593

*(data++) = (cp >> 16) & 0xff;

594

*(data++) = (cp >> 8) & 0xff;

595

*(data++) = cp & 0xff;

596

}

597

} else {

598

while (i.hasNext()) {

599

uint cp = i.next();

600

601

*(data++) = cp & 0xff;

602

*(data++) = (cp >> 8) & 0xff;

603

*(data++) = (cp >> 16) & 0xff;

604

*(data++) = cp >> 24;

}

}

if (state) {

state->remainingChars = 0;

610

state->flags |= QTextCodec::IgnoreHeader;

}

return d;

}

QString QUtf32::convertToUnicode(const char *chars, int len, QTextCodec::ConverterState *state, DataEndianness e)

616

{

617

DataEndianness endian = e;

618

uchar tuple[4];

619

int num = 0;

620

bool headerdone = false;

621

if (state) {

622

headerdone = state->flags & QTextCodec::IgnoreHeader;

623

if (endian == DetectEndianness) {

624

endian = (DataEndianness)state->state_data[Endian];

625

}

626

num = state->remainingChars;

627

memcpy(tuple, &state->state_data[Data], 4);

628

}

629

if (headerdone && endian == DetectEndianness)

630

endian = (QSysInfo::ByteOrder == QSysInfo::BigEndian) ? BigEndianness : LittleEndianness;

631

632

QString result;

633

result.resize((num + len) >> 2 << 1); // worst case

634

QChar *qch = (QChar *)result.data();

635

636

const char *end = chars + len;

637

while (chars < end) {

638

tuple[num++] = *chars++;

639

if (num == 4) {

640

if (!headerdone) {

641

if (endian == DetectEndianness) {

642

if (tuple[0] == 0xff && tuple[1] == 0xfe && tuple[2] == 0 && tuple[3] == 0 && endian != BigEndianness) {

643

endian = LittleEndianness;

644

num = 0;

645

continue;

646

} else if (tuple[0] == 0 && tuple[1] == 0 && tuple[2] == 0xfe && tuple[3] == 0xff && endian != LittleEndianness) {

647

endian = BigEndianness;

648

num = 0;

649

continue;

650

} else if (QSysInfo::ByteOrder == QSysInfo::BigEndian) {

651

endian = BigEndianness;

652

} else {

653

endian = LittleEndianness;

654

}

655

} else if (((endian == BigEndianness) ? qFromBigEndian<quint32>(tuple) : qFromLittleEndian<quint32>(tuple)) == QChar::ByteOrderMark) {

num = 0;

continue;

}

}

uint code = (endian == BigEndianness) ? qFromBigEndian<quint32>(tuple) : qFromLittleEndian<quint32>(tuple);

661

if (QChar::requiresSurrogates(code)) {

662

*qch++ = QChar::highSurrogate(code);

663

*qch++ = QChar::lowSurrogate(code);

} else {

*qch++ = code;

}

num = 0;

}

}

result.truncate(qch - result.unicode());

if (state) {

if (headerdone)

state->flags |= QTextCodec::IgnoreHeader;

675

state->state_data[Endian] = endian;

676

state->remainingChars = num;

677

memcpy(&state->state_data[Data], tuple, 4);

}

return result;

}

#ifndef QT_NO_TEXTCODEC

684

685

QUtf8Codec::~QUtf8Codec()

{

}

QByteArray QUtf8Codec::convertFromUnicode(const QChar *uc, int len, ConverterState *state) const

690

{

691

return QUtf8::convertFromUnicode(uc, len, state);

692

}

693

694

void QUtf8Codec::convertToUnicode(QString *target, const char *chars, int len, ConverterState *state) const

695

{

696

*target += QUtf8::convertToUnicode(chars, len, state);

697

}

698

699

QString QUtf8Codec::convertToUnicode(const char *chars, int len, ConverterState *state) const

700

{

701

return QUtf8::convertToUnicode(chars, len, state);

702

}

703

704

QByteArray QUtf8Codec::name() const

{

return "UTF-8";

}

int QUtf8Codec::mibEnum() const

{

return 106;

}

QUtf16Codec::~QUtf16Codec()

{

}

QByteArray QUtf16Codec::convertFromUnicode(const QChar *uc, int len, ConverterState *state) const

719

{

720

return QUtf16::convertFromUnicode(uc, len, state, e);

721

}

722

723

QString QUtf16Codec::convertToUnicode(const char *chars, int len, ConverterState *state) const

724

{

725

return QUtf16::convertToUnicode(chars, len, state, e);

726

}

727

728

int QUtf16Codec::mibEnum() const

{

return 1015;

}

QByteArray QUtf16Codec::name() const

{

return "UTF-16";

}

QList<QByteArray> QUtf16Codec::aliases() const

739

{

740

return QList<QByteArray>();

741

}

742

743

int QUtf16BECodec::mibEnum() const

{

return 1013;

}

QByteArray QUtf16BECodec::name() const

{

return "UTF-16BE";

}

QList<QByteArray> QUtf16BECodec::aliases() const

754

{

755

QList<QByteArray> list;

return list;

}

int QUtf16LECodec::mibEnum() const

{

return 1014;

}

QByteArray QUtf16LECodec::name() const

{

return "UTF-16LE";

}

QList<QByteArray> QUtf16LECodec::aliases() const

770

{

771

QList<QByteArray> list;

return list;

}

QUtf32Codec::~QUtf32Codec()

{

}

QByteArray QUtf32Codec::convertFromUnicode(const QChar *uc, int len, ConverterState *state) const

780

{

781

return QUtf32::convertFromUnicode(uc, len, state, e);

782

}

783

784

QString QUtf32Codec::convertToUnicode(const char *chars, int len, ConverterState *state) const

785

{

786

return QUtf32::convertToUnicode(chars, len, state, e);

787

}

788

789

int QUtf32Codec::mibEnum() const

{

return 1017;

}

QByteArray QUtf32Codec::name() const

{

return "UTF-32";

}

QList<QByteArray> QUtf32Codec::aliases() const

800

{

801

QList<QByteArray> list;

return list;

}

int QUtf32BECodec::mibEnum() const

{

return 1018;

}

QByteArray QUtf32BECodec::name() const

{

return "UTF-32BE";

}

QList<QByteArray> QUtf32BECodec::aliases() const

816

{

817

QList<QByteArray> list;

return list;

}

int QUtf32LECodec::mibEnum() const

{

return 1019;

}

QByteArray QUtf32LECodec::name() const

{

return "UTF-32LE";

}

QList<QByteArray> QUtf32LECodec::aliases() const

832

{

833

QList<QByteArray> list;

return list;

}

#endif //QT_NO_TEXTCODEC

838

839

QT_END_NAMESPACE

Generated by Squish Coco Non-Commercial 4.3.0-BETA-master-30-08-2018-4cb69e9