python - 使用 sklearn 获取实时数据

标签 python machine-learning scikit-learn real-time

我有一个使用 python 连接的健康患者数据的实时数据源。我想对此数据源运行一些 sklearn 算法,以便我可以实时预测是否有人会生病。是否有一种标准方法可以将实时数据连接到 sklearn?传统上我有静态数据集,从来没有传入流,所以这对我来说是很新鲜的。如果有人使用了一些通用规则/流程/工具,那就太好了。

最佳答案

对于大多数算法来说,训练很慢,而预测却很快。因此最好使用训练数据进行离线训练;然后使用训练好的模型实时预测每个新案例。

显然,如果您获得更多/更好的数据,您可能会决定稍后再次训练。然而,在每个案例之后进行再培训并没有什么好处。

关于python - 使用 sklearn 获取实时数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41899011/

相关文章:

python - PyMongo 中的 MapReduce

建立排名/评分系统的数学模型

matlab - 使用 KNN 进行词袋分类

python - sklearn : How to speed up a vectorizer (eg Tfidfvectorizer)

python-3.x - 如何在 F-beta 分数中选择 beta

python - 比较在Python中两个字典的相同索引处找到的键值对

python - 使用 try...except 捕获特定异常

python - 线性拟合 pandas.datetime64 值?

python - 使用 pandas 将多数据类型数据帧转换为 python 中的整数编码数据帧

python - 如何自己实现tf.argmax?