文字转unicode编码(unicode编码转化)
如何将WORD文档转化为Unicode编码格式文件
1、工具→选项→常规→Web 选项→编码→“将此文档另存为”下拉框里选择您希望的编码方式,点击两次“确定”,最后保存。
2、Alt+X
指定的(十六进制)Unicode 字符代码对应的 Unicode 字符。例如,若要插入欧元货币符号(),请键入“20AC”,然后在按下 Alt 的同时按 X。
3、ALT+字符代码(数字键盘上)
指定的(十进制)ANSI 字符代码对应的 ANSI (ANSI 字符集:Microsoft Windows 使用的 8 位字符集,允许您使用键盘表示多达 256 个字符(0 到 255)。ASCII 字符集是 ANSI 集的子集。) 字符。例如,若要插入欧元符号,请在按下 Alt 的同时在数字键盘上按 0128。
怎么将汉字转换成unicode
unicode编码不需要转换成汉字,因为unicode就是和字符关联的终极编码。windows中只有unicode码可以和字符直接关联,也就是使用国际标准的unicode字符集。中文windowsXp默认的内码是gbk(装过gb18030补丁的话也就变成gb18030),日文系统就是JIS,不同语言版本的windows都有不同的默认内码,这是每个国家的标准化管理局规定的。然后就是页码表的概念,所谓页码表就是把一个用系统默认编码(比如gbk,gb2312)表示的字符映射到对应unicode编码,而每个unicode编码对应着唯一确定的字符。这样就完成了地域性编码到国际标准码再到字符的对应关系。在控制面板-区域和语言选择-高级,里面可以看到window提供的所有页码表。
请问如何用C语言实现汉字,和Unicode编码的转换?
字转换:wctomb、mbtowc,wc 指 Wide charactor,mb 指 Multi-byte。\r\n字符串转换:wcstombs、mbstowcs,wcs 和 mbs 的 s 指 string。\r\n\r\n这 4 个函数是 C 标准函数库函数中的。如果只是在 Windows 平台下编程,可直接调用 Windows API 函数 WideCharToMultiByte 和 MultiByteToWideChar 实现。但是如果调用标准库函数的话,在 Linux 下也是有效的。调用标准库函数,首先必须包含 locale.h 并调用 setlocale(LC_ALL, "") 后才能正确转换。Windows 下的 Multi-byte 是 ANSI 编码的,Wide charactor 是 Unicode (UTF-16) 编码,而 Linux 下的 Multi-byte 是 UTF-8 编码的,Wide charactor 是 Unicode (UTF-32) 编码。\r\n\r\n#include \r\n#include \r\n#include \r\n\r\nint main(void)\r\n{\r\n char str[12];\r\n wchar_t wstr[] = { 0x52B3, 0x788C, 0 };\r\n setlocale(LC_ALL, "");\r\n wcstombs(str, wstr, sizeof(str)/sizeof(char));\r\n printf("%s", str);\r\n return 0;\r\n}
怎样将其他格式编码的文本文档批量转换成Unicode的格式?
你好,推荐用Replace
Pioneer批量转换编码。
不确定你需要转换成utf8格式还是utf16。以utf8为例:
假设你的文件是ansi(gbk),用Replace
Pioneer批量转换为UTF8的方法如下:
第一步:选文件
1.打开Tools-Batch
Runner菜单
2.点击Pick
Files,用鼠标对需要处理的多个文件进行多选。如果你需要的文件类型选不了,把文件类型改选成All
files
*.*
第二步:变换编码
1.点击Change
Encode按钮
2.点击input
encoding,设置成CN-gbk
3.点击output
encoding,设置成utf-8
4.点击start,完成
注:如果你想把输出保存到新文件里,可以在点击Start之前修改set
output
filename,把它从${FILENAME}改成新的规则,比如${FILENAME}.new,还要注意备份,以防操作失误。
如果你要的utf-8文件带BOM标识,需要选utf-8-BOM而不是utf-8
怎么把汉字转换成unicode编码
unicode编码不需要转换成汉字,因为unicode就是和字符关联的终极编码。
windows中只有unicode码可以和字符直接关联,也就是使用国际标准的unicode字符集。
中文windowsXp默认的内码是gbk(装过gb18030补丁的话也就变成gb18030),日文系统就是JIS,不同语言版本的windows都有不同的默认内码,这是每个国家的标准化管理局规定的。
然后就是页码表的概念,所谓页码表就是把一个用系统默认编码(比如gbk,gb2312)表示的字符映射到对应unicode编码,而每个unicode编码对应着唯一确定的字符。这样就完成了地域性编码到国际标准码再到字符的对应关系。
在控制面板-区域和语言选择-高级,里面可以看到window提供的所有页码表。