Python的列表理解和其他更好的实践

标签 python arrays list statistics python-2.6

这与将 SAS 中的 2-way ANOVA 程序转换为 Python 的项目有关。

周四我几乎开始尝试学习这门语言,所以我知道我还有很大的改进空间。如果我遗漏了一些明显的东西,一定要告诉我。我还没有启动和运行 Sage,也没有运行 numpy,所以现在,这完全是普通的 Python 2.6.1。 (便携)

主要查询:需要一组良好的列表理解,可以按因素 A、按因素 B、整体以及按因素 A 和 B (AxB) 的每个级别分组提取列表中样本列表中的数据。

经过一些工作,数据为以下形式(3层嵌套列表):

响应[a][b][n]

(意思是[a1 [b1 [n1, ... ,nN] ...[bB [n1, ...nN]]], ... ,[aA [b1 [n1, ... ,nN ] ...[bB [n1, ...nN]]] 希望这很清楚。)

我示例中的因子水平:A=3 (0-2)、B=8 (0-7)、N=8 (0-7)

byA= [[a[i] for i in range(b)] for a[b] in response]

(有人可以解释为什么这种语法有效吗?我无意中发现了它,试图看看解析器会接受什么。我没有在其他地方看到这种行为附加的语法,但它真的很好。任何关于该主题的站点或书籍上的良好链接将不胜感激。编辑:运行之间变量的持久性解释了这种奇怪现象。它不起作用。)

byB=lstcrunch([[Bs[i] for i in range(len(Bs)) ]for Bs in response])

(值得注意的是 zip(*response) 几乎可以满足我的要求。我记得上面的版本实际上并没有工作。我还没有通过仔细的测试来运行它.)

byAxB= [item for sublist in response for item in sublist]

(从本网站上 Alex Martelli 的回复中窃取。有人可以再次解释为什么吗?列表理解语法在我阅读的文本中没有得到很好的解释。)

ByO= [item for sublist in byAxB for item in sublist]

(显然,我只是在这里重复使用了之前的理解,因为它满足了我的需要。编辑:)

我希望这些以相同的数据类型结束,至少在被相关因素 s.t. 循环时是这样。可以应用和使用相同的平均/求和/SS/等等函数。

这很容易被更干净的东西取代:

def lstcrunch(Dlist):
    """Returns a list containing the entire
    contents of whatever is imported,
    reduced by one level.

    If a rectangular array, it reduces a dimension by one.
    lstcrunch(DataSet[a][b]) -> DataOutput[a]
    [[1, 2], [[2, 3], [2, 4]]] -> [1, 2, [2, 3], [2, 4]]
    """
    flat=[]
    if islist(Dlist):#1D top level list
        for i in Dlist:
            if islist(i):
                flat+= i
            else:
                flat.append(i)
        return flat
    else:
        return [Dlist]

哦,当我谈到这个话题时,将变量标识为列表的首选方法是什么? 我一直在使用:

def islist(a):
    "Returns 'True' if input is a list and 'False' otherwise"
    return type(a)==type([])

离别查询: 有没有办法明确强制浅拷贝转换为深拷贝?复制?或者,类似地,当复制到一个变量中时,是否有一种方法可以声明赋值也应该替换指针,而不仅仅是值? (s.t. 赋值不会传播到其他浅拷贝)同样,有时使用它也可能很有用,因此能够控制它何时发生或不发生听起来非常好。 (当我通过调用准备要插入的表时,我真的把自己踩得遍体鳞伤: 响应=[[[0]*N]*B]*A )

编辑: 进一步的调查导致大部分工作正常。从那以后,我已经上过课并进行了测试。它工作正常。我将完整保留列表理解形式以供引用。

def byB(array_a_b_c):
    y=range(len(array_a_b_c))
    x=range(len(array_a_b_c[0]))
    return [[array_a_b_c[i][j][k]
    for k in range(len(array_a_b_c[0][0]))
    for i in y]
    for j in x]


def byA(array_a_b_c):
    return [[repn for rowB in rowA for repn in rowB] 
    for rowA in array_a_b_c]

def byAxB(array_a_b_c):
    return [rowB for rowA in array_a_b_c 
    for rowB in rowA]

def byO(array_a_b_c):
    return [rep
    for rowA in array_a_b_c
    for rowB in rowA
    for rep in rowB]


def gen3d(row, col, inner):
"""Produces a 3d nested array without any naughty shallow copies.

[row[col[inner]] named s.t. the outer can be split on, per lprn for easy display"""
    return [[[k for k in range(inner)]
    for i in range(col)]
    for j in range(row)]

def lprn(X):
    """This prints a list by lines.

    Not fancy, but works"""
    if isiterable(X):
        for line in X: print line
    else:
        print x

def isiterable(a):
    return hasattr(a, "__iter__")

感谢所有回复的人。由于我的 gnosis 的改进,已经看到代码质量有了显着提高。当然,进一步的想法仍然值得赞赏。

最佳答案

byAxB= [item for sublist in response for item in sublist] Again could someone explain why?

我确定 A.M.就能给你一个很好的解释。这是我在等待他出现时所做的尝试。

我会从左到右处理这个问题。拿这四个字来说:

for sublist in response

我希望您能看到与常规 for 循环的相似之处。这四个词正在为对 response 中的每个 sublist 执行某些操作做基础工作。 response 似乎是一个列表列表。在这种情况下,sublist 将是通过 response 进行的每次迭代的列表。

for item in sublist

这又是另一个 for 循环。鉴于我们在之前的“循环”中第一次听说 sublist,这表明我们现在正在遍历子列表,一次一个 item。如果我在没有理解的情况下写出这些循环,它看起来像这样:

for sublist in response:
    for item in sublist:

接下来,我们看剩下的单词。 [项目]。这实际上意味着收集列表中的项目并返回结果列表。

每当您在创建或理解列表迭代时遇到困难时,编写相关的 for 循环,然后压缩它们:

result = []

for sublist in response:
    for item in sublist:
        result.append(item)

这将压缩为:

[
    item 
    for sublist in response
    for item in sublist
]

List comprehension syntax is not very well explained in the texts I've been reading

Dive Into Python 有一个 section致力于列表理解。还有这个好看tutorial通读。

更新

我忘了说点什么。列表理解是实现传统上使用 map 完成的任务的另一种方式。和 filter .如果您想提高理解力,最好了解 mapfilter 的工作原理。

关于Python的列表理解和其他更好的实践,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3597955/

相关文章:

python - 将 MS Azure 上麦克风的连续语音识别存储到单独的变量

python - 为什么提早返回比其他方法慢?

java - 我如何知道可以存储在数组中的元素的最大范围?

python - 对表(列表的列表)中的列进行排序,同时保留行的对应关系

python - 如何在Python 3中立即打印结尾=""?

arrays - 无法将类型 'Meme!' 的值转换为预期参数类型 '@noescape (Meme) throws -> Bool'

java - 使用自定义适配器将 XML 中的数据解析为列表

python - 如何在 python 中迭代 readlines()

python - 列表内容的长度,里面有列表

javascript - 如何让Python成为客户端?