新闻资讯
当前全球AI主流开源软件多达90余种,各种AI开源软件的特性有所差异,这为金融科技领域的应用系统和工具的研发提供便利的同时,也造成了选型的困难。传统的依靠专家经验选择AI开源软件的方法难以合理地胜任当前金融业务的需求和金融科技的发展。因此,探索并提出一套客观的、科学的AI开源软件选型方法是金融科技发展中亟需解决的问题之一。 金融科技中的AI开源软件选型力求面向金融业务,解决实际问题,着重考虑金融业务中面临的技术实现重点。例如,业务需求究竟突出资源利用性,还是突出兼容性等等。一般来说,AI 开源软件的选型方法包括四个主要过程:启动、构造、评价和选择。AI 开源软件的评价和选择的关键是在构造过程中明确需求,根据需求筛选候选AI 开源软件,通过从评价模型中选择合适的指标对候选AI 开源软件进行评价,最终做出选型的决策。其选型过程如下图 所示。 1. 启动 为AI 开源软件的评价和选择定义一般的目标和需求,并确定管理相关的内容(如进度、资源、成本等),包括: 2. 构造 根据使用AI 开源软件的领域和应用场景分析需求,评价AI 开源软件相关的必要信息,***确定候选软件集,包括: 3. 评价 根据选型需求对候选软件集中的AI 开源软件进行评价,包括: 4. 选择 将候选软件的评价结果进行比较,选取最适合的AI 开源软件,并确保所推荐的软件满足最初设定目标,包括: a) 选择准备:最终确定选择准则,并定义选择算法; b) 选择算法:对评价结果应用某种选择算法是选择过程的重要组成部分。选择过程主要依靠对特性加权,并用某种算法综合这些带加权的评价评级结果。 加权的考虑 对特性和子特性的加权应反映该组织的实际需要。 为使评价能为选择过程提供有用的信息,如果各候选软件在满足该组织的特别需求方面有明显不同, 需对确定候选软件的权重加以区别。组织应对难以评价的特性赋予较窄的等级范围。用户应为反映该组织实际需要的特性以及能被详细评价的特性制定较高的权重。 算法类型 在开展结果评价过程中,算法选择途径包括: 目前通常使用的评价算法包括基于成本、基于得分和基于排名的算法。组织在选择算法过程中,宜保证有足够资源实现这种算法,且该算法适合相应的特定情况。 基于成本的算法 根据需求确定***可接受的应用层次,并确定所有提供该能力的软件,将可接受的软件按成本排名。成本***的可接受软件即是可能的推荐软件。该方法的缺点是难以精确定义实际用户的需求,低成本的软件仅能满足最基本需求。 基于得分和排名的算法 通过给每个组织所需的权重值乘以一个数值,并累加这些乘积为每个软件计算出一个单值。在基于得分的算法中,权重是根据某些预定义的尺度反映该软件如何能满足需要的得分。在基于排名的算法中, 被加权的数是一个与其他考虑的软件,进行比较时反映该软件如何满足需要的顺序排名。 轮廓算法 消费产品测试机构通常会对每一种候选产品提供轮廓形式的结果,评价对用户比较重要的特性,并将结果输入到选择过程中。选择者检查这些轮廓性结果并给予不同的特性对于该组织的相对重要性的判断来进行选择。 c) 评估评价结果:将选择算法应用到候选软件集评价中进行综合评估; d) 推荐***结果:确定***候选AI 开源软件; e) 软件验证:将推荐的选择决定与最初的目标进行确认。 表1 评价内容与对应的指标 参考文献 1. 《信息技术服务 人工智能 开源软件选型指南》(AIOSS-02-2019) 2. 《人工智能深度学习算法评估规范》(AIOSS—01—2018) 3. 人工智能在金融行业的应用探析[J].金融科技时代,2019(09):26-28. 4. 金融科技发展趋势分析[J/OL].科技经济市场 上海U8代理商,用友软件服务商,报销管理系统,软件定制评价内容 评价指标 指标详解 功能 完备性 软件涵盖的AI算法、数据处理方法、与外界进行交互的完备程度; 正确性 使用软件实现算法、进行数据处理、与外界进行交互时的正确程度。 适合性 使用软件实现算法、进行数据处理、与外界进行交互时的适合程度。 性能 时间特性 响应时间、周转时间、吞吐率。 资源利用性 CPU占用率、内存占用率、外存时间负载、外存空间占用率、传输带宽负载、I/O设备占用率。 容量 ***请求数、事务累积容量、数据吞吐容量、数据处理容量。 兼容 共存性 在与其它软件共享通用的环境和资源条件下,AI开源软件能够有效执行其所需的功能并不会对其它软件或其它AI开源软件造成负面影响的程度。 数据一致性 软件实现降低数据同步延迟,保证数据的一致性,避免造成数据混乱和失准的程度。 可协同性 被测AI开源软件与其它AI软件以及训练的模型间的互操作程度。 易用 可辨识性 根据软件资料或软件操作来辨识软件功能的程度。 易学性 软件资料的丰富度、软件使用的难易度、疑难问题的解答频率。 易操作性 用户使用软件实现功能的难易程度;用户通过用户界面使用软件操作的难易程度。 可靠 成熟性 缺陷排除率、平均故障间隔时间、故障密度、缺陷密度、验证覆盖率。 可用性 服务时间率、平均故障间隔时间、特殊条件运行时间满足度。 容错性 避免宕机率、避免失效率、抵御发生的误操作率、冗余率。 易恢复性 复原能力、备份数据率、可重新启动性、故障通告时间满足度。 运营组织的可靠性 组织涉及政治或外交时,软件可靠和安全的程度。 信息安全 保密性 访问数据和访问操作的可控制性。 完整性 软件防止数据抗讹误能力符合需求的程度;缓冲区溢出的预防。 可核查性 访问数据、访问类型的可审计性;日志保存的符合性。 维护 可重用性 模块可重用率;注释、代码、文档的规范性。 易修改性 代码的可修改性、可配置性、维护实施的效率、修改的复杂度、软件变更的可控性。 易测试性 是否可以通过软件自动验证来完成;维护后,是否容易地用检测点执行测试。 可移植 适应性 硬件、操作系统、数据库、支撑软件、组织环境、通信环境、数据结构、开发语言的适应能力; 易安装性 软件安装的难易程度、是否会影响其它软件或环境、安装时间;安装后是否正常运行,功能是否完整,是否可由用户定制。 易替换性 软件更新或升级后,相同数据或相似功能是否可以继续正常使用,新功能是否与用户期望一致,是否被用户接受。
文章内容如有侵权,请联系站长删除。
推荐文章