雷火电竞-中国电竞赛事及体育赛事平台

歡迎來到入門教程網(wǎng)!

C語言

當前位置:主頁 > 軟件編程 > C語言 >

C語言中判斷一個char*是不是utf8編碼

來源:本站原創(chuàng)|時間:2020-01-10|欄目:C語言|點擊:

C語言中判斷一個char*是不是utf8編碼

里我修改了一下, 純ASCII編碼的字符串也返回true, 因為UTF8和ASCII兼容

實例代碼:

int utf8_check(const char* str, size_t length) { 
  size_t i; 
  int nBytes; 
  unsigned char chr; 
 
  i = 0; 
  nBytes = 0; 
  while (i < length) { 
    chr = *(str + i); 
 
    if (nBytes == 0) { //計算字節(jié)數(shù) 
      if ((chr & 0x80) != 0) { 
        while ((chr & 0x80) != 0) { 
          chr <<= 1; 
          nBytes++; 
        } 
        if ((nBytes < 2) || (nBytes > 6)) { 
          return 0; //第一個字節(jié)最少為110x xxxx 
        } 
        nBytes--; //減去自身占的一個字節(jié) 
      } 
    } else { //多字節(jié)除了第一個字節(jié)外剩下的字節(jié) 
      if ((chr & 0xC0) != 0x80) { 
        return 0; //剩下的字節(jié)都是10xx xxxx的形式 
      } 
      nBytes--; 
    } 
    i++; 
  } 
  return (nBytes == 0); 
} 

感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!

上一篇:2~62位任意進制轉(zhuǎn)換方法(c++)

欄    目:C語言

下一篇:c++10進制轉(zhuǎn)換為任意2-16進制數(shù)字的實例

本文標題:C語言中判斷一個char*是不是utf8編碼

本文地址:http://www.jygsgssxh.com/a1/Cyuyan/1428.html

網(wǎng)頁制作CMS教程網(wǎng)絡(luò)編程軟件編程腳本語言數(shù)據(jù)庫服務器

如果侵犯了您的權(quán)利,請與我們聯(lián)系,我們將在24小時內(nèi)進行處理、任何非本站因素導致的法律后果,本站均不負任何責任。

聯(lián)系QQ:835971066 | 郵箱:835971066#qq.com(#換成@)

Copyright © 2002-2020 腳本教程網(wǎng) 版權(quán)所有