马尔可夫链是生成 random gibberish 的(几乎是标准的)方式未经训练的眼睛看起来很聪明。您将如何从人类书面文本中识别马尔可夫生成的文本。
如果您指向的资源是 Python 友好的,那就太棒了。
最佳答案
一种简单的方法是让一大群人为您阅读输入文本,看看文本是否有意义。我只是半开玩笑,这是一个棘手的问题。
我认为这是一个难题,因为马尔可夫链生成的文本在词频和词序之间的简单关系方面将具有许多与真实人类文本相同的属性。
真实文本和马尔可夫链生成的文本之间的区别在于更高级别的语法规则和语义含义,这些很难以编程方式进行编码。另一个问题是马尔可夫链在生成文本方面足够好,它们有时会产生语法和语义正确的陈述。
例如,这是一个 aphorism from the kantmachine :
Today, he would feel convinced that the human will is free; to-morrow, considering the indissoluble chain of nature, he would look on freedom as a mere illusion and declare nature to be all-in-all.
虽然这个字符串是由计算机程序编写的,但很难说人类永远不会这样说。
我认为,除非您能向我们提供有关计算机和人工生成的文本的更具体的细节,以揭示更明显的差异,否则很难使用计算机编程来解决这个问题。
关于python - 识别马尔可夫生成内容的算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1185369/