“会计并不总是机器学习中谈论最多的话题,”人工智能会计初创公司Digits的谷歌云冠军创新者和机器学习工程师 Hannes Hapke在最近的一次采访中观察到。
他和他的同事正在努力改变这种状况。
Digits 成立于 2018 年,利用云服务扩展其尖端的机器学习 (ML) 专业知识,帮助企业加快会计工作流程并更好地了解其财务状况并采取行动。
以其 Digits Transaction Review 产品为例。每个曾经提交过费用报告的人都知道分类收据的烦恼,每个曾经批准过费用报告的人都知道更正错误分类的费用或核实成本类别的烦恼。
ML 不仅可以识别各种费用的交易情况,还可以检测过去是否对类似费用进行了分类。识别这些类别并促进围绕它们的沟通提供了为什么交易在分类账中的背景——而这正是 Digits Transaction Review 目标的用例。
会计中的 ML 不仅限于更简单、更方便的费用跟踪。
“我们正在构建机器学习工具,以帮助会计师和企业主实时了解他们的业务,”Hapke 解释道。“通过实时生成人工智能帮助会计师对账簿进行分类并向客户提出问题,企业主可以更快地得到答案,会计师的工作效率也会大大提高。”
从报告生成到为有关企业财务的自然语言查询提供精确答案的语义搜索,Digits 正在利用 ML 使整个会计管道更快、更智能。
将 ML 转变为一项业务:调整团队、简化流程和扩展模型
Hapke 在多个行业的 ML 方面拥有悠久的历史,包括已发表的机器学习文献。根据他的经验,不断增长的机器学习业务面临的最大挑战并不总是通过模型进行创新——它通常是弄清楚如何构建高效、可扩展的机器学习系统和能够为付费客户提供服务的 MLOps 流程。这家初创公司使用了各种 Google Cloud 的Vertex AI功能来克服这一挑战。
“对于我们这种规模的公司,归根结底是可持续性与工程时间的对比,”他解释道。他回忆说,在 Vertex AI 发布之前,该公司使用Google Kubernetes Engine (GKE)在内部部署了模型。
Hapke 说,“当我们想要使用 GPU 或并行运行我们的管道或实施不同的 MLOps 流程时,这种方法达到了极限”。“Kubernetes 可以解决一些问题,但它需要更多的工程开销。这不是我们想要支持的——作为一个 ML 团队,我们的能力是构建模型。”
Vertex AI 帮助 Digits 将资源和人才专注于创新的 ML 模型和产品,而不是基础设施管理、维护工作流和其他 MLOps 流程的细节。
例如,Digits 以前使用另一个系统来管理和部署模型,每当引入新模型或需要扩展资源时,这都需要大量的工程工作。他们求助于Vertex AI Model Registry来简化这些令人头疼的 MLOps,并腾出技术人才来从事高影响力的工作。
Hapke 将 Model Registry 描述为“一站式商店”,并指出他和同事可以查看完整的模型目录、构建现有模型、引入新模型并部署到端点。“一切都可以在本地实现,但工程成本要高得多,”他说。
与此同时,除了让 Digits 简单地并行运行模型而无需担心扩展问题之外,Vertex AI Pipelines 还帮助 Digits 实施和简化一系列治理、故障排除和 MLOps 任务。例如,在原型制作阶段,公司的工程师使用各种语言和框架,但模型在进入生产阶段时通常是标准化的,而 Vertex AI 会强制执行合规性。
“我什至无法手动部署模型,”Hapke 说。“一切都必须通过 Vertex AI 管道进行部署,通过我们的 CI/CD 系统。” 他指出,这种标准化不仅有助于部署批准过程中的身份验证,还有助于从不同模型的性能、新员工的入职以及团队成员围绕效率最佳实践的调整中获得洞察力。
随着数据流动:实时应用机器学习
最新的数据和见解在财务规划和分析 (FP&A) 用例中可能至关重要,这使得 Vertex AI 的匹配引擎流式摄取功能对Digits 特别有用。Matching Engine 是一个完全托管的矢量数据库,可确保数据不断更新并立即反映在相似性搜索中。这让 Digits 能够以低延迟检索最新的特征值以进行高度准确的预测,提取实时数据集进行训练,并为 Boost 等产品提供动力,通过自动执行手动质量控制任务来节省会计师的时间。
“匹配引擎的流式摄取一直是 Digits Boost 能够实时提供功能和分析的关键,”Hapke 说,并指出虽然 Digits 以前将交易更新限制为 24 小时批处理计划,但他们现在可以向客户提供反馈几乎立即。
MLOps:危急时刻的“人寿保险”
除了简化和加快流程以使模型更快地投入生产之外,Vertex AI 还让 Digits 团队高枕无忧。“我们可以从 Jupyter notebook 部署初始原型,没问题。但随着时间的推移保持该模型并保持该过程的健全——这是不可能的。Vertex AI Pipelines 保持理智,”Hapke 说。
他解释说,如果 Digits 遇到问题,Vertex AI 可以让团队更快地找到并解决问题,因为该平台对元数据和模型沿袭进行了编目。
“在模型中再现问题并不能告诉你为什么模型不正确地映射概念或有其他问题,”他解释道。“借助 Vertex AI Pipelines,您可以追溯哪个模型在哪个时间从哪个训练集中进行训练,这有助于快速找到错误注释的数据。在这些时刻,MLOps 就是人寿保险。”
这种“人寿保险”对于稳健、可持续的 ML 服务至关重要,它完善了帮助 Digits 创新的 MLOps 工具集和最佳实践。凭借独创性、数据专业知识以及支持云的资源和流程,该公司正在展示如何让世界上最古老的职业之一——会计——变得令人兴奋和焕然一新。对于任何 ML 初创公司甚至是寻求最佳实践的大型企业团队来说,这是一项值得注意的成就。