这是一道纯编程题。我有一系列的话。单词后面有不同长度的停顿(大部分为零)。每个词也有一个确定性分数。我想从前瞻窗口中选择最佳的单词跨度。
- 总体确定性越低越好(或者说确定性的第 33 个百分位数越低越好)。
- 边缘停顿时间越长越好(最低限度)。
- 会有一个最佳长度(例如 5 秒)。离它越近越好。对最小和最大长度有硬性限制。
注意,这是在 JavaScript 中,所以我不能使用支持向量机或类似的东西。 :-) 对于性能思想,它可能会在 2 分钟长度(250 字左右)的窗口上每分钟计算一次。
第二个注意事项给有兴趣的人:这是选择一段由自动语音识别生成的单词进行手动转录(主动学习)。
你会如何处理这个问题?
最佳答案
经过一夜的 sleep ,问题得到了解决。实际上需要很少的魔法。由于候选跨度的数量非常有限(在最坏的情况下,窗口中单词数量的平方 - 250^2),我可以简单地评估每个跨度的适合度并选择得分最高的那个。
呃,为什么我昨天没看到这个?
关于javascript - 选择最佳跨度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17865954/