服务器之家:专注于服务器技术及软件下载分享
分类导航

PHP教程|ASP.NET教程|Java教程|ASP教程|编程技术|正则表达式|C/C++|IOS|C#|Swift|Android|VB|R语言|JavaScript|易语言|vb.net|

服务器之家 - 编程语言 - C/C++ - C语言中判断一个char*是不是utf8编码

C语言中判断一个char*是不是utf8编码

2021-05-18 16:17sidyhe C/C++

这篇文章主要介绍了C语言中判断一个char*是不是utf8编码的相关资料,需要的朋友可以参考下

C语言中判断一个char*是不是utf8编码

里我修改了一下, 纯ASCII编码的字符串也返回true, 因为UTF8和ASCII兼容

实例代码:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
int utf8_check(const char* str, size_t length) {
  size_t i;
  int nBytes;
  unsigned char chr;
 
  i = 0;
  nBytes = 0;
  while (i < length) {
    chr = *(str + i);
 
    if (nBytes == 0) { //计算字节数
      if ((chr & 0x80) != 0) {
        while ((chr & 0x80) != 0) {
          chr <<= 1;
          nBytes++;
        }
        if ((nBytes < 2) || (nBytes > 6)) {
          return 0; //第一个字节最少为110x xxxx
        }
        nBytes--; //减去自身占的一个字节
      }
    } else { //多字节除了第一个字节外剩下的字节
      if ((chr & 0xC0) != 0x80) {
        return 0; //剩下的字节都是10xx xxxx的形式
      }
      nBytes--;
    }
    i++;
  }
  return (nBytes == 0);
}

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

原文链接:http://blog.csdn.net/sidyhe/article/details/51935180

延伸 · 阅读

精彩推荐