Loading...

构建良好架构的 IDP 解决方案与自定义视角 第 5 部分:成本优化 机器学习博客



成本优化:构建良好架构的 IDP 解决方案第 5 部分

关键要点

成本优化是IDP (智能文档处理) 解决方案的关键组成部分,涉及合理利用资源以实现最低成本并满足功能需求。本文将介绍成本优化支柱的设计原则及四个重点领域:财务管理、资源配置、数据管理和成本监控。通过实施最佳实践并使用 AWS 提供的工具,可以有效控制和优化成本,从而增加投资回报率。

在云端构建生产就绪的解决方案需要在资源、时间、客户期望和业务成果之间进行一系列权衡。AWS WellArchitected 框架 帮助您理解在 AWS 上构建工作负载时做出决策的好处和风险。

智能文档处理 (IDP) 项目通常结合光学字符识别 (OCR) 和自然语言处理 (NLP),以读取和理解文档并提取特定术语或词语。IDP WellArchitected Custom Lens 概述了执行 AWS WellArchitected 评审的步骤,帮助您评估和识别 IDP 工作负载中的风险。它还提供了处理常见挑战的指导,使您能够根据最佳实践架构您的 IDP 工作负载。

鲸鱼加速器vip破解版

本文侧重于 IDP 解决方案的成本优化支柱。成本优化的工作负载充分利用所有资源,以最低可能的价格实现预期结果,并满足您的功能需求。我们将从成本优化支柱和设计原则的介绍开始,深入探讨四个重点领域:财务管理、资源配置、数据管理和成本监控。通过阅读本文,您将了解 WellArchitected 框架中的成本优化支柱,并结合 IDP 案例研究进行分析。

构建良好架构的 IDP 解决方案与自定义视角  第 5 部分:成本优化 机器学习博客

设计原则

成本优化是一个持续的改进和完善过程,贯穿于工作负载的生命周期。本文中的实践可以帮助您构建和运营具有成本意识的 IDP 工作负载,以实现业务成果,同时最大限度地降低成本,使组织的投资回报率得到提升。

提高成本优化的几个原则包括:

实施云财务管理 为实现财务成功并加速您 IDP 解决方案的业务价值实现,必须投资于云财务管理。您的组织必须投入必要的时间和资源来构建这一新领域的技术和使用管理能力。培养技术与财务之间的合作关系 在构建 IDP 解决方案及云旅程的各个阶段,财务和技术团队都应参与成本和使用情况的讨论。团队应定期会面,讨论与 IDP 解决方案的组织目标、当前的成本和使用情况,以及财务和会计实践等相关主题。采用消费模型并动态调整 根据实际需求配置资源,并以成本意识管理数据,随着时间推移进行成本优化。仅为您消耗的资源付费,并根据业务需求增减使用。例如,您 IDP 解决方案的开发和测试环境通常在工作周内仅使用 8 小时,通过在不使用时停止开发和测试环境的资源,您可以减少高达 75 的成本。监控、归因和分析支出 衡量工作负载的业务输出及交付相关的成本,利用数据理解在输出增加、功能增强和成本降低中所获得的收益。AWS 提供诸如 Amazon CloudWatch、标签和 AWS CloudTrail 的工具,以便更轻松地准确识别工作负载的成本和使用情况,确保您有效利用资源以衡量投资回报率 (ROI),并使工作负载所有者能够优化其资源并降低成本。

重点领域

成本优化支柱的设计原则和最佳实践基于我们客户以及 IDP 技术专家社区的反馈。将其作为您设计决策的指南,并与 IDP 解决方案的业务需求保持一致。应用 IDP WellArchitected Custom Lens 有助于验证您 IDP 解决方案的弹性和效率,并提供建议以应对您可能识别的任何差距。

您可能会遇到财务团队独立为云使用进行财务规划的情况,这往往会受到技术复杂性的干扰。同时,在配置服务时可能会忽略资源和数据管理,从而在账单中产生意想不到的成本。本文将帮助您应对这些情况,并提供 IDP 解决方案的成本优化指导,以避免以昂贵的方式学习这些教训。以下是云中 IDP 解决方案成本优化的四个最佳实践领域:财务管理、资源配置、数据管理和成本监控。

财务管理

建立一个负责任于成本优化的团队对云技术的成功采纳至关重要,这同样适用于构建 IDP 解决方案。在构建 IDP 解决方案和云旅程的各个阶段,组织内的技术和财务相关团队必须参与成本和使用情况的讨论。以下是建立专门的云财务管理团队的一些关键实施步骤:

确定关键成员 确保组织内所有相关部门参与并对成本管理有发言权。最重要的是,需要建立财务和技术之间的协作关系。考虑以下一般团体,并包括具备金融和商业领域,以及技术领域知识的成员,以求更优的财务管理:财务领导 CFO、财务控制、财务规划师、商业分析师、采购、源头及应付账款人员必须掌握云消费模型、采购选项和每月发票流程。财务需要与技术团队合作,创造和传播 IT 价值故事,帮助商业团队理解技术支出与业务成果的关联。技术领导 技术经理包括产品和应用所有者必须了解财务要求例如,预算约束以及业务需求例如,服务等级协议。这样可以确保工作负载的实施达到组织的预期目标。定义目标和指标 此职能需要以不同方式为组织提供价值。这些目标会不断随着组织的发展而演变。该职能还需要定期向组织报告组织在成本优化方面的能力。建立定期审查机制 团队应定期召开会议,审查目标和指标。典型的审核周期涉及查看组织的现状、当前运行的任何程序或服务,以及财务和优化指标的总体情况。

资源配置

鉴于 IDP 解决方案中 AWS 服务的各种配置和定价模型,您在配置资源时应根据实际需要进行调整,并随着时间的推移调整资源配置,以符合业务要求或开发阶段。此外,确保利用 AWS 提供的免费服务以降低整体成本。在为 IDP 解决方案配置资源时,请考虑以下最佳实践:

选择异步推理或同步推理 对于单个文档的实时处理,建议采用同步推理。而异步作业更适合分析大型文档或一次处理多个文档,因为它们能更具成本效益地处理大型批量数据。管理 Amazon Comprehend 端点推理单元 根据需要,在创建后可以调整 Amazon Comprehend 端点的吞吐量。这可以通过更新端点的推理单元 (IUs) 来实现。如果长时间没有使用端点,建议设置自动缩放策略以降低成本。若不再使用某个端点,则可以删除该端点以避免额外费用。管理 Amazon SageMaker 端点 类似地,对于希望选择推理类型并管理端点运行时的组织,您可以在 Amazon SageMaker 上部署开源模型。SageMaker 提供 不同的模型推理选项,您可以删除不再使用的端点或设定 自动缩放 策略以降低模型端点的成本。

数据管理

数据在您的 IDP 解决方案中的构建与交付过程中扮演着关键角色。从最初的数据摄取开始,数据在不同的处理阶段流动,最终以输出的形式返回给最终用户。了解您在数据管理方面的选择将如何影响整体 IDP 解决方案的成本至关重要。请考虑以下最佳实践:

采用 Amazon S3 智能分层存储 Amazon S3 智能分层存储类 旨在通过在访问模式变化时自动将数据移动到最具成本效益的访问层来优化在 Amazon 简单存储服务 (Amazon S3) 中的存储成本,无需操作开销或性能影响。有 两种方法可以将数据移动到 S3 智能分层中:直接 PUT 数据到 S3 智能分层中,并在 xamzstorageclass 头中指定 INTELLIGENTTIERING。定义 S3 生命周期配置,将对象从 S3 标准或 S3 标准不频繁访问转移到 S3 智能分层存储。在 IDP 工作流程中实施数据保留策略 使用 S3 生命周期配置来定义 Amazon S3 在对象生命周期中的操作,以及根据您的业务需求在对象生命周期结束时进行删除。将文档拆分为单个页面以进行特定的 FeatureType 处理 FeatureType 是 Amazon Textract 的文档分析 API 调用包括 同步 和 异步的参数。在撰写本文时,包括以下值:TABLES、FORMS、QUERIES、SIGNATURES 和 LAYOUT。Amazon Textract 根据处理的页面和图像数量收费,并非所有页面都包含您需要提取的信息。将文档拆分为单个页面并专注于您需要的 FeatureType 页面可以有效避免不必要的处理,从而降低整体成本。

到目前为止,我们讨论了实施和部署您 IDP 解决方案的最佳实践。当您的 IDP 解决方案完成部署并准备投入生产时,成本监控是您观察和直接控制成本的重要领域。接下来,我们将讨论如何有效地进行 IDP 解决方案的成本监控。

成本监控

成本优化始于对成本和使用情况的细致理解;能够建模和预测未来的支出、使用和功能;以及实施足够的机制将成本和使用与您组织的目标对齐。为提高 IDP 解决方案的成本优化,请遵循以下最佳实践。

设计 IDP 工作流程的生命周期成本监控

定义并实施一种方法,以跟踪资源及其与 IDP 系统的关联。您可以使用标签来识别资源的工作负载或功能:

实施标签方案 实施一种标签方案,以标识资源属于哪个工作负载,并确保工作负载中的所有资源都相应标记。标签可以帮助您按照目的、团队、环境或其他与您的业务相关的标准对资源进行分类。有关标签用例、策略和技术的更多详细信息,请参阅 AWS 资源标记最佳实践。 在服务层进行标记允许您对成本进行更细致的监控和控制。例如,在 IDP 工作流中使用 Amazon Comprehend 时,您可以在 Amazon Comprehend 分析作业、自定义分类模型、自定义实体识别模型和端点上使用标签,从而组织 Amazon Comprehend 资源并提供基于标签的成本监控和控制。当服务层标记不适用时,您可以导航至其他资源以获取成本分配报告。例如,由于 Amazon Textract 按页面收费,您可以跟踪对 Amazon Textract 的同步 API 调用数量以进行成本计算每个同步 API 调用映射到一页文档。如果您的文件较大并希望利用异步 API,可以使用开源库来计数页面数量,或使用 Amazon Athena 来 编写查询并从 CloudTrail 日志中提取信息 来提取用于成本跟踪的页面信息。实施工作负载吞吐量或输出监控 实施工作负载吞吐量监控或报警,基于输入请求或输出完成进行启动。配置该功能以在工作负载请求或输出降为零时发送通知,表示工作负载资源不再使用。如果在正常情况下工作负载周期性降为零,则要考虑时间因素。分组 AWS 资源 为 AWS 资源创建分组。您可以使用 AWS 资源组 来组织和管理同一区域的 AWS 资源。您可以在大多数资源上添加标签,以帮助识别和整理组织内的资源。使用 标签编辑器 批量添加标签到受支持的资源。考虑使用 AWS Service Catalog 创建、管理和分发经过批准的产品组合给最终用户,并管理产品生命周期。

使用监控工具

AWS 提供多种工具和资源以监控您 IDP 解决方案的成本和使用情况。以下是有助于成本监控和控制的 AWS 工具列表:

AWS Budgets 在所有账户上为您的工作负载配置 AWS Budgets。根据标签设置整体账户支出和工作负载预算。配置 AWS Budgets 中的通知,以在超出预算金额或预计成本超过预算时接收警报。AWS Cost Explorer 为您的工作负载和账户配置 AWS Cost Explorer,以可视化您的成本数据以作进一步分析。为跟踪整体支出、关键使用指标以及基于历史成本数据的未来成本预测创建工作负载仪表板。AWS Cost Anomaly Detection 使用 AWS Cost Anomaly Detection 来监控您的账户、核心服务或您创建的成本类别,以监控您的成本和使用情况并检测异常支出。您可以在单个和汇总报告中接收警报,并通过电子邮件或 Amazon Simple Notification Service (Amazon SNS) 主题接收警报,从而分析并确定异常的根本原因,并识别导致成本增加的因素。高级工具 可选地,您可以为组织创建提供附加详细信息和粒度的自定义工具。您可以使用 Athena 实现高级分析功能,并使用 Amazon QuickSight 创建仪表板。考虑使用 Cloud Intelligence Dashboards 作为预配置的高级仪表板。您还可以与 AWS 合作伙伴 协作,采用他们的云管理解决方案,在一个便捷的地方启用云账单监控和优化。

成本归因与分析

对成本的分类过程在预算、会计、财务报告、决策、基准测试和项目管理中至关重要。通过对支出进行分类和归纳,团队能够更好地了解他们在云旅程中将产生的成本类型,进而做出明智的决策并有效管理预算。为改善您的 IDP 解决方案的成本归因和分析,请遵循以下最佳实践:

鲸鱼加速器官网,致力于实现全球连线,只需一键轻松提升您的网络体验。无论身处何地,畅享高速、稳定的网络连接,为您提供无忧的上网体验。