artificial-intelligence - 如何在边缘实现安全关键型 AI 计算集群?

标签 artificial-intelligence failover redundancy nvidia-jetson safety-critical

我想尝试开发一种可以处理所有 AI 和其他计算内容的冗余自动驾驶汽车计算架构。为此,我购买了一些包含集成 GPU 的边缘计算设备(Nvidia Jetson TX2s)。然后我用千兆以太网交换机连接它们,这样我就可以与它们通信了。

我需要您对系统架构的建议。我如何实现这个故障安全、安全关键和冗余系统?有一些集群示例可以提供高可用性。但我想这样做:“每个计算节点都运行相同的进程,然后它们将结果输出到主节点。主节点分析并投票结果并选择最好的一个。如果计算节点出现故障(错误、系统故障、电力不足等) ),系统应该意识到故障并将故障节点的计算负载转移到正常节点。此外,每个节点都应该运行一些特定于节点的任务,而不受协作进程的影响。”

你的想法是什么?任何关键字、建议、方法推荐都对我有帮助。

最佳答案

汽车的主要系统/软件安全标准是ISO 26262 .如果您打算认真地制作汽车产品,您将需要获取一份副本并按照流程进行操作。

汽车自主级别的主要分类是 SAE J3016_201806 .通过事先了解您要拍摄的级别,您可以预先省去很多麻烦。在尝试做更复杂的事情之前,您可能想要像自适应巡航控制或车道偏离预防系统这样的 1 级(“动手”)。

以下是我从安全方面收集到的一些一般主题:

  • 没有普遍接受的方法来确定软件故障的可能性。甚至有一种观点认为 software does not fail .相反,大多数安全标准将软件中实现的安全重要功能分配给不同的“级别”,这些级别需要根据某些标准进行更高级别的审查,包括严重性、与危险的接近程度(是否存在互锁?)等。
  • 大多数安全标准将软件定义为在硬件上运行的一切,因此您需要确保您使用的操作系统也符合标准。这通常意味着实时操作系统。
  • 让您的安全重要功能尽可能简单。如果您可以使用基本电路和逻辑门(例如紧急停止)做一些事情,那就去做吧,因为硬件的数学和分析要成熟得多。
  • 获得并遵守与安全相关的编码标准。汽车应用的主要应用是 MISRA C .
  • 考虑使用 fault tree analysis确定事故发生所需的故障关系。这也有助于识别单点故障。
  • 如果可能,尽量减少设计中的危险。程序缓解和个人防护设备应该是最后的手段。
  • 至少,您需要为安全驾驶员提供硬电子紧急 parking 装置和由观察员操作的远程控制紧急 parking 装置。

关于artificial-intelligence - 如何在边缘实现安全关键型 AI 计算集群?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57585903/

相关文章:

c# - 多线程应用程序冗余

python - 神经网络 - 检查节点激活

graph - 使用机器学习改进益智游戏人工智能

Azure 流量管理器 SSL 设置(非经典)

activemq - 仅当从属在故障转移中变为事件状态时,如何在从属 ActiveMQ 上启动 Camel 路由?

postgresql - 在 PostgreSQL 中重用旧的 master 作为 slave

mysql - 数据库方法 - 冗余数据

javascript - 比较jquery中的相似字符串

machine-learning - 神经网络的准确性正在下降

language-agnostic - 液态状态机的实现