python - 在不下载文件的情况下在网站上查找音频文件的比特率

标签 python bitrate

我想在不下载文件的情况下在网站上查找 mp3 的比特率。 使用 Python3 & Mutagen 移植版

代码

from mutagen.id3 import ID3
audio = ID3("http://songs.djmazadownload.com/music/indian_movies/Creature%20(2014)/01%20-%20Creature%20-%20Sawan%20Aaya%20Hai%20%5BDJMaza.Info%5D.mp3")
print (audio.info.length, audio.info.bitrate)

错误

Traceback (most recent call last):
  File "C:\Python_Mass_downloader\New folder\download.py", line 20, in <module>
    audio = ID3("http://songs.djmazadownload.com/music/indian_movies/Creature%20(2014)/01%20-%20Creature%20-%20Sawan%20Aaya%20Hai%20%5BDJMaza.Info%5D.mp3")
  File "C:\Python34\lib\site-packages\mutagen\id3.py", line 76, in __init__
    super(ID3, self).__init__(*args, **kwargs)
  File "C:\Python34\lib\site-packages\mutagen\_util.py", line 41, in __init__
    super(DictProxy, self).__init__(*args, **kwargs)
  File "C:\Python34\lib\site-packages\mutagen\__init__.py", line 46, in __init__
    self.load(*args, **kwargs)
  File "C:\Python34\lib\site-packages\mutagen\id3.py", line 122, in load
    self._fileobj = open(filename, 'rb')
OSError: [Errno 22] Invalid argument: 'http://songs.djmazadownload.com/music/indian_movies/Creature%20(2014)/01%20-%20Creature%20-%20Sawan%20Aaya%20Hai%20%5BDJMaza.Info%5D.mp3'

示例输入

http://songs.djmazadownload.com/music/indian_movies/Creature%20%282014%29/01%20-%20Creature%20-%20Sawan%20Aaya%20Hai%20%5BDJMaza.Info%5D.mp3

也欢迎任何其他方式:) 谢谢你

最佳答案

首先:

I Dont want to download the files . I just need to check from the server . I also want to Find image's (jpg,png etc) information like size , pixels . Is it posssible ?

不,这不可能。获取该信息的唯一方法是解析文件数据,除非下载文件数据,否则无法解析文件数据。

当然,如果服务器以其他方式提供该信息,例如通过 REST 或 RPC API,或者您可以抓取的网页,那么您可以下载该信息……但在那种情况下,您并没有解析自己归档,你不需要诱变剂。 (如果你控制服务器,你总是可以添加一个网络应用程序在服务器端进行解析并以你想要的任何格式提供信息。)


如果您只是担心将文件保存到磁盘:无论是来自 stdlib 还是来自第三方模块,Python 中大多数需要文件名的函数都不能使用网络 URL。这与其他一些语言不同,后者在任何地方都使用 URL,并尽可能以相同的方式处理 http 和文件 URL(通过将文件 block 逐 block 下载到内存中)。

但是,大多数需要文件 对象 的函数都可以采用 urlrequest 或类似对象,如果不能,通常可以采用 BytesIO 。因此,您无需将其下载到磁盘上的文件中:

import urllib.request

r = urllib.request.open(url)
spam(r)

问题是,我不认为像 ID3 这样的 Mutagen 的“简单 API”函数可以获取文件对象,只能获取文件名。因此,您将不得不使用不同的库、使用较低级别的函数*或下载到临时文件。

但即使是最后一个也没有那么糟糕:

import tempfile
import urllib.request

r = urllib.request.open(url)
with tempfile.NamedTemporaryFile(mode='wb', delete=False) as f:
    f.write(r.read())
try:
    id3 = mutagen.id3.ID3(f.name)
finally:
    os.remove(f.name)

或者,如果您不关心 Windows,您可以将其简化为:

r = urllib.request.open(url)
with tempfile.NamedTemporaryFile(mode='wb') as f:
    f.write(r.read())
    f.flush()
    id3 = mutagen.id3.ID3(f.name)

NamedTemporaryFile创建并打开一个临时文件。默认情况下,它会在您关闭它时立即被删除(这会在 with 语句结束时立即发生)。以这种方式使用它的问题是,在 Windows 上,ID3 可能无法打开临时文件,直到您关闭它,这意味着您必须通过 delete=False到构造函数,然后显式 os.remove 稍后。笨拙,但这是我所知道的以对所有平台都安全且健壮的方式编写它的最佳方式。 (同样,如果您不关心 Windows,只需使用更简单的第二个版本。)

如果你不理解with语句,PEP 343可能解释得最好,但过于简单化了一点,这个想法是运行所有缩进代码,然后自动关闭文件(即使您 return 或在缩进代码中间引发异常)。


可以从 HTTP 服务器获得的少数东西之一是文件的大小。服务器通常会为每个响应发送一个 Content-Length: header ,如果您发送一个 HEAD 请求而不是一个 GET,您只会得到标题,而不是所有数据。所以:

>>> req = urllib.request.Request(url, method='HEAD')
>>> resp = urllib.request.urlopen(req)
>>> size = int(resp.headers['Content-Length'])
6201098

* 事实上,我什至不确定“使用低级函数”是否是一个选项;我记不清了,但我认为能够使用打开的文件对象或字符串代替文件名是 MusicBrainz 必须添加到他们的 Mutagen 分支中的东西,因为没有办法做到这一点。

关于python - 在不下载文件的情况下在网站上查找音频文件的比特率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25814773/

相关文章:

php - 如何检测嵌入式视频编码比特率

python - 无法从 site-packages 目录加载通过 pip 安装的 Python 模块

python - 为什么 "file"命令对 .py 文件感到困惑?

python - 如何使用用户定义的类对象作为 networkx 节点?

python - 使用 lxml 更改文本值

python - 在推导式中匹配字典键元组项

bash - Linux/bash - ffmpeg - 以一半比特率和一半分辨率编码文件

python - 如何使用OpenCV Python库更改视频的比特率