我目前正在寻找处理和解析来自 this .txt file 的信息.该文件似乎是制表符分隔的。我希望将以 16 为基数的值(即 000000)解析为字典键,并将公司名称(即 Xerox Corporation)解析为字典值。因此,例如,如果我在字典中查找键 000001,Xerox Corporation 将作为相应的值返回。
我已经尝试将 .txt 文件解析为 csv,读取每第 n 行的条目,但不幸的是没有模式,第 n 个数字也不同。
有没有什么方法可以捕获术语“base 16”之前的值,然后捕获它后面的术语以构成字典条目?
非常感谢
最佳答案
Well 条目用两个换行符分隔。第二行始终是 base16。第一个tab前的数据是base16键,最后一个是公司名。
import urllib
inputfile = urllib.urlopen("http://standards.ieee.org/develop/regauth/oui/oui.txt")
data = inputfile.read()
entries = data.split("\n\n")[1:-1] #ignore first and last entries, they're not real entries
d = {}
for entry in entries:
parts = entry.split("\n")[1].split("\t")
company_id = parts[0].split()[0]
company_name = parts[-1]
d[company_id] = company_name
部分结果:
40F52E: Leica Microsystems (Schweiz) AG
3831AC: WEG
00B0F0: CALY NETWORKS
9CC077: PrintCounts, LLC
000099: MTX, INC.
000098: CROSSCOMM CORPORATION
000095: SONY TEKTRONIX CORP.
000094: ASANTE TECHNOLOGIES
000097: EMC Corporation
000096: MARCONI ELECTRONICS LTD.
000091: ANRITSU CORPORATION
000090: MICROCOM
000093: PROTEON INC.
000092: COGENT DATA TECHNOLOGIES
002192: Baoding Galaxy Electronic Technology Co.,Ltd
90004E: Hon Hai Precision Ind. Co.,Ltd.
002193: Videofon MV
00A0D4: RADIOLAN, INC.
E0F379: Vaddio
002190: Goliath Solutions
关于python - 将 .txt 文件处理成字典 (Python v2.7),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8068138/