VIM查看中文编码文件显示为乱码的解决办法VIP免费

下载本文档

阅读 166
下载 11
格式 pdf
大小 202.8 KB
约6页
2024-12-05 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/6页

2/6页

3/6页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

文本预览下载提示常见问题

如果你需要在Linux中操作windows下的文件，那么你可能会经常遇到文件编码转换的问题。Windows中默认的文件格式是 GBK(gb2312)，而 Linux一般都是 UTF-8。下面介绍一下，在Linux中如何查看文件的编码及如何进行对文件进行编码转换。查看文件编码在Linux中查看文件编码可以通过以下几种方式： 1.在Vim中可以直接查看文件编码 :set fileencoding 即可显示文件编码格式。如果你只是想查看其它编码格式的文件或者想解决用 Vim查看文件乱码的问题，那么你可以在 ~/.vimrc 文件中添加以下内容： let &termencoding=&encoding set fileencodings=utf-8,ucs-bom,gbk,cp936 这样，就可以让 vim自动识别文件编码（可以自动识别 UTF-8或者 GBK编码的文件），其实就是依照 fileencodings提供的编码列表尝试，如果没有找到合适的编码，就用 latin-1(ASCII)编码打开。文件编码转换 1.在Vim中直接进行转换文件编码,比如将一个文件转换成 utf-8格式 :set fileencoding=utf-8 2. iconv 转换，iconv的命令格式如下： iconv -f encoding -t encoding inputfile 比如将一个 UTF- 8 编码的文件转换成 GBK编码 iconv -f GBK -t UTF-8 file1 -o file2 Linux 对一个 3G的文本进行编码转换全过程本过程中涉及到的Linux的命令有：split, iconv, cat 问题：有一个 3G 的文本 a.txt，编码格式为 gbk，现在需要对其进行转换成为 utf-8。难点：iconv的转换是在内存中进行的，因此 3G大小的文本，无法进行直接转换。思路：先利用 split进行文件切分，然后对每一个字文件进行 ivonv转换，最后进行 cat合并。 1) ll -h a.txt 查看文件的大小，2.9G 2) wc -l a.txt 查看文件的行数，9千200万行 3) split -l 20000000 a.txt chunk 按照每个文件2千万行进行切割，共分成5个文件 4) 进行转换 iconv -f gbk -t utf-8 chunka > chunka_utf8 -c iconv -f gbk -t utf-8 chunkb > chunkb_utf8 -c iconv -f gbk -t utf-8 chunkc > chunkc_utf8 -c iconv -f gbk -t utf-8 chunkd > chunkd_utf8 -c iconv -f gbk -t utf-8 chunke > chunke_utf8 -c 5) rm chunka chunkb chunkc chunkd chunke 删除原文件 6) cat chunk* > a.txt_utf8 进行合并至此，工作完成二、批量文件编码转换本操作有风...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

VIM查看中文编码文件显示为乱码的解决办法

如果你需要在Linux中操作windows下的文件，那么你可能会经常遇到文件编码转换的问题

Windows中默认的文件格式是 GBK(gb2312)，而 Linux一般都是 UTF-8

下面介绍一下，在Linux中如何查看文件的编码及如何进行对文件进行编码转换

查看文件编码在Linux中查看文件编码可以通过以下几种方式： 1

在Vim中可以直接查看文件编码 :set fileencoding 即可显示文件编码格式

如果你只是想查看其它编码格式的文件或者想解决用 Vim查看文件乱码的问题，那么你可以在 ~/

vimrc 文件中添加以下内容： let &termencoding=&encoding set fileencodings=utf-8,ucs-bom,gbk,cp936 这样，就可以让 vim自动识别文件编码（可以自动识别 UTF-8或者 GBK编码的文件），其实就是依照 fileencodings提供的编码列表尝试，如果没有找到合适的编码，就用 latin-1(ASCII)编码打开

文件编码转换 1

在Vim中直接进行转换文件编码,比如将一个文件转换成 utf-8格式 :set fileencoding=utf-8 2

iconv 转换，iconv的命令格式如下： iconv -f encoding -t encoding inputfile 比如将一个 UTF- 8 编码的文件转换成 GBK编码 iconv -f GBK -t UTF-8 file1 -o file2 Linux 对一个 3G的文本进行编码转换全过程本过程中涉及到的Linux的命令有：split, iconv, cat 问题：有一个 3G 的文本 a

txt，编码格式为 gbk，现在需要对其进行转换成为 utf-8

难点：iconv的转换是在内存中进行的，

小辰5 + 关注: 实名认证
内容提供者

出售各种资料和文档

收藏店铺进入空间

VIM查看中文编码文件显示为乱码的解决办法VIP免费

VIM查看中文编码文件显示为乱码的解决办法

您可能关注的文档

相关文档

热门下载

相关标签