服务器之家:专注于服务器技术及软件下载分享
分类导航

Linux|Centos|Ubuntu|系统进程|Fedora|注册表|Bios|Solaris|Windows7|Windows10|Windows11|windows server|

服务器之家 - 服务器系统 - Linux - Linux下文件名、文件和mp3名字、pdf的乱码问题

Linux下文件名、文件和mp3名字、pdf的乱码问题

2019-12-10 15:55Linux教程网 Linux

Linux下MP3乱码主要是因为大陆大多数MP3文件都是用GBK/GB18030编码写入标签信息的,而大多数的linux播放器默认以utf-8编码读取,这就产生了乱码

如果是刚刚从windows转到Linux下的,通常都会因为一些中文的问题而放弃,我就是这样装上,卸载搞过好几次,其实这种心态是永远都学不到东西的,真正的学者都具有一颗大无畏的精神,在他们的字典里是找不到退缩的,好了,不扯了,下面转入正题。

    这里我用到了三个工具,convmv, iconv, python-mutagen.分别处理上述三个问题,下面一一介绍:

    convmv 实现文件名字的转换:
    sudo apt-get install convmv
    convmv -f code1 -t code2 -r

    code1:目录原来使用的字符集编码。支持gb2312, gbk, big5,不支持gb18030和big5-hkscs
    code2:预转换到的字符集编码。对于ubuntu,这里填写utf8

    -r 参数:转换子目录
    -f : from
    -t : to
    dir:要转换的目录

    man convmv查看帮助文件,这个非常有用,学会看Linux的帮助文档对于Linux和英语的学习都有很大益处,强烈建议大家多使用man命令:)

    iconv实现文件内容的转换:

    iconv -f code1 -t code2 oldfile > newfile

    其他命令和参数请大家使用man进行查阅,并不是我懒,我是不想让大家变懒,不管怎样,我们都应该自己去体会这个过程,这样才能把它真正学会。

    python-mutagen---mp3 ID3 tags设置工具
    Mutagen 是一个用来处理声音相关数据的 Python
    模块.它支持 ID3(所有版本),APEv2,Ogg Vorbis,FLAC和Ogg
    FLAC读取,以及ID3v1.1,ID3v2.4,APEv2,Ogg Vorbis,FLAC还有Ogg
    FLAC信息写入.也可以用来读取MPEG音频和Xing标题.FLAC流信息块,以及Ogg vorbis,Ogg
    FLAG流标题.最后,它包含一个处理Ogg 流的模块.
    mid3v2 -a artist -A album -t title -c comment -g genre mp3file
    设置mp3file的ID3 tags
    find . -iname "*.mp3" -execdir mid3iconv -e GBK {} \;
     
    这会转换当前目录其子目录中的 mp3 文件标签编码为正确的 utf8,-execdir意思是对查到的每个文件执行后面的shell脚本,脚本中-e GBK意思是文件原来使用的字符集编码,读者还可以man find一下,看看-iname和-name的区别,呵呵,总是喜欢给你们卖关子:)
    PDF乱码问题解决:
    第一步,安装中文语言支持包:
    sudo apt-get install xpdf-chinese-simplified xpdf-chinese-traditional
    安装完后打开pdf文档,如果发现仍然是乱码,进行第二步,安装安装poppler-data:从8.04开始,源中开始提供poppler-data安装包的支持,可以直接输入命令 
    sudo apt-get install poppler-data
    或者去官方下载tar.gz压缩包自己安装,网址是 
    http://poppler.freedesktop.org/
    ,自己编译安装,在此不在熬述
    若第一,二步完成后,打开pdf文档中文乱码都变成方块的话,就进行第三步,删除字体
    sudo rm /etc/fonts/conf.d/49-sansserif.conf
    好了,到这里,相信大家可以开心的使用Linux了,我是很开心啦,一次性解决了乱码问题是一方面,另一方面,今天我的blog被Google收录了,呵呵,这就意味这我的这些笔记可以给更多的人提供参考了,同样我的笔记也借鉴了很多人的笔记,正所谓取之于民,用之于民也 :)

只需要把mp3标签里面用gbk、gb18030、big5等编码存储的中文内容修改为Unicode编码,那么基本上所有Linux下的播放器都能正常识别mp3标签了。
关于mp3编码的转换,介绍一个工具----Mutagen,假如你安装了Quod Libet,那么这个包已经安装上去了。如果没有,执行下列命令就可以了。 

sudo apt-get install python-mutagen 

工具的使用方法 

#转换mp3文件所在的目录下,执行:
         mid3iconv -e gbk *.mp3   
#转换当前目录下所有mp3文件(包括子目录)执行:
         find . -iname "*.mp3" -execdir mid3iconv -e gbk {}; 
如果觉得每次都要输入命令很麻烦,也可以建立个shell脚本来批量转换:
          新建文件,写入:

 

复制代码

代码如下:


#!/bin/sh
IFS=""
find . -iname "*.mp3" -execdir mid3iconv -e gbk {}; 

 

然后把文件保存,拷贝到想要转换的目录下,执行就可以了(执行脚本的命令为 #sh filename)。

因为现在在网上下载的mp3绝大多数采用的都是gbk/gb18030编码,-e gbk
参数是代表把gbk编码的标签转换为Unicode编码,假如mp3标签本身是Unicode编码的就不转换。如果需要转换其他编码的文件可以自行修改
gbk参数,比如改为gb18030、big5。转换后为的mp3标签类型为ID3v2 2.4,编码格式为UTF-16。

到了这一步之后,在Linux下使用所有播放器估计都没有什么问题了。  
下面我们回过头来看看,追溯一下根源,为什么这些mp3原来在Windows下用Media Player怎么都是显示正常的呢?难道是Linux不如Windows吗?其实这个道理很简单,Firefox同样也打不开很多IE轻松就能打开的页面,能说明Firefox不如IE吗?知情的人一看就明白了。Windows为了它所谓的兼容性,完全无视规范,自定规则,貌似它的软件兼容性很好,其实
到头来,毁的还是用户,从众多的不符合W3C规范的网页和现在铺天盖地的mp3标签
再转一个更牛的
转换文件名由GBK为UTF8
sudo apt-get install convmv
convmv -r -f cpArray36 -t utf8 ?notest ?nosmart *
批量转换src目录下的所有文件内容由GBK到UTF8

find src -type d -exec mkdir -p utf8/{} ;
find src -type f -exec iconv -f GBK -t UTF-8 {} -o utf8/{} ;
mv utf8/* src
rm -fr utf8

转换文件内容由GBK到UTF8
iconv -f gbk -t utf8 $i > newfile
转换 mp3 标签编码
sudo apt-get install python-mutagen
find . -iname "*.mp3" -execdir mid3iconv -e GBK {} ;

Linux下MP3名字乱码

解决方法:安装python-mutagen 
安装方法(root权限,你懂得) 
fedora等红帽的: 
yum install python-mutagen 
ubuntu等debian的: 
apt-get install python-mutagen 
安完后 
mid3iconv -e gbk *.mp3 
OK~

延伸 · 阅读

精彩推荐
  • Linuxlinux设置tomcat自启动的方法

    linux设置tomcat自启动的方法

    这篇文章主要介绍了linux设置tomcat自启动的方法,需要的朋友可以参考下...

    Linux教程网8512021-10-10
  • Linuxlinux驱动程序开发详细介绍

    linux驱动程序开发详细介绍

    前提,一般来说内核代码的错误可能会引起一个用户进程的死亡,或者整个系统的瘫痪,更严重的后果,可能导致磁盘损伤~因此建议最好有一台实验机进行...

    Linux教程网5392019-12-17
  • LinuxLinux系统下无法卸载挂载的目录怎么办?

    Linux系统下无法卸载挂载的目录怎么办?

    我们在日常运维中经常性会遇到需要进行磁盘的扩容、卸载、挂载等操作,但是有时候这个系统上跑的应用并没有停止或者有其他的运维同事在操作这个目...

    今日头条10302020-12-30
  • Linuxlinux top命令详解

    linux top命令详解

    这篇文章主要介绍了linux top命令详解,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧...

    sparkdev5622022-03-01
  • Linux在Linux系统中创建新的亚马逊AWS访问密钥的方法

    在Linux系统中创建新的亚马逊AWS访问密钥的方法

    如何在Linux系统中创建新的亚马逊AWS访问密钥?我在配置一个需要访问我的亚马逊AWS帐号的应用时被要求提供AWS访问密钥ID和秘密访问密钥,我怎样创建一个...

    Linux教程网6182019-10-30
  • Linux理解 Linux/Unix 登录脚本的技巧

    理解 Linux/Unix 登录脚本的技巧

    有一些常见的情况,例如从Debian的包管理程序到Iaas的管理中,很多任务需要设置环境变量才能正常运行。 有时,程序通常只需要在 登陆时运行一次,例如...

    未知1042023-05-12
  • Linux将 Linux 终端与 Nautilus 文件管理器结合起来

    将 Linux 终端与 Nautilus 文件管理器结合起来

    Nautilus 是 GNOME 桌面环境中的图形化文件浏览器。你可以使用它来访问和管理系统中的文件和文件夹。 尽管并非所有人都喜欢使用终端来管理文件和目录,...

    未知812023-08-08
  • Linuxssh 登录很慢该如何解决

    ssh 登录很慢该如何解决

    这篇文章主要介绍了ssh 登录很慢该如何解决的相关资料,这里提供了两种方法,DNS反向解析及关闭ssh的gssapi认证的解决办法,需要的朋友可以参考下...

    linuxeye9922021-12-16