人工智能驱动企业：通过情境感知AI重塑组织4个人生产力

富账慕 · 2025-8-1 11:34:50

4 个人生产力

Sasha 是一名手术室护士。今天是平常的一天。她正在为一位病人制定术前程序。今天的手术是标准的——疝气手术。然而，即使是常规手术，术前程序也会因病人的既往病史和当前健康状况而异。
制定术前计划不仅仅是重复标准模板，它还涉及关键决策。Sasha 必须概述针对每位病人的具体步骤。她必须确定必要的预防措施。由于其他原因，她今天的病人正在服用血液稀释剂。她必须通知他暂时停药。
无论病例细节如何，Sasha 的决策过程都很复杂。它包含基于病人病史的多个信息模块。它需要系统地得出结论。人工智能可以提供帮助。然而，在部署人工智能来帮助改进决策之前，决策者必须从信息的角度掌握这些决策是如何做出的，这一点至关重要。
上一章探讨了决策的两大支柱——感知和推理。然而，为了加深我们的理解，必须进一步解构每项任务的结构。我们将在第五章和第六章的基础上，分别探讨交互和市场的结构。
让我们回到任务的信息结构——并通过回顾我们手术室护士Sasha的工作来说明这一点。

正如我们在第3章中提到的，感知和推理在个人决策中包括两个不同的步骤。每个步骤都可以进一步细分。感知包括情境化阶段和生成阶段。情境化阶段——决策过程的第一阶段——是感知情境的阶段。对Sasha来说，情境化涉及了解患者的具体病史以及手术要求。
情境感知AI可以在这方面提供帮助，例如，通过挖掘患者病史中的自然语言数据。但正如我们在第三章中所述，这方面的技术仍在不断发展。现有的大型语言模型（LLM）仅具备部分感知能力，这限制了它们作为企业环境中工具的实用性。企业每天面对的复杂文档，需要比目前大多数AI更具感知能力的AI。
让我们回到手术室。Sasha可能会生成多个似乎适合患者的术前计划。通常，她会运用自己的经验和判断力，并结合对各种情境因素的理解来生成这些选项。
Transformer 中嵌入的情境感知 AI 的生成功能可以帮助自主生成行动方案，这是决策过程中感知的第二阶段。同样，开箱即用的 LLM
可能会产生幻觉并给出错误的结果。因此，任何情境感知 AI 都必须基于特定领域的文档、证据和规则，以防止出现此类结果。
推理包括选择阶段和评估阶段。回到我们的例子，Sasha 必须对方案列表进行排序，并从有限的方案中选出最合适的方案。这是选择阶段，即决策的第三阶段。它需要对情境和意图有深入的理解。Sasha 可能会运用她的经验和判断力，并结合一些基本的决策工具，例如电子表格。使用情境感知 AI 可以进一步增强此类工具的使用。
通过将感知步骤中已凸显的不同信息片段串联起来，这使得选择过程更加高效。虽然情境感知人工智能可以根据一系列标准推荐方案，但通常仍需要人类的判断来做出最终选择。
最后，一旦该计划部署完成，手术完成，系统会收集不同利益相关者对此次体验的反馈。在这种情况下，还会对术前计划的有效性进行审查。最终，系统会对关键决策的影响进行细致的了解。然后，正面或负面的反馈会被回滚到Sasha的知识库中，以便她改进未来的决策。决策过程的最后一个阶段是评估。它独立于前三个阶段，但却是整个过程中至关重要的一部分——因为它会影响未来的决策。
4.1 情境感知人工智能应用于各行各业的任务

上述基本框架可在各行各业的各种业务任务中得到应用。我们将通过以下一些案例研究来说明。
我们的目的并非提供详细的用户列表案例，例如咨询公司网站上的案例。我们仅提供一小部分用例，以说明任务结构中的四个组成部分。我们大致按照情境感知能力的提升顺序排列这些示例；也就是说，算法将面对越来越多样化、不断变化的情境。
4.1.1 农业 - 气候田间视图

气候田间视图是一个数字农业系统。它旨在通过收集、存储和分析农民的种植面积，并提出最佳的作物和肥料组合来优化产量。它量化并分析了世界上每块田地的独特因素，例如地形、土壤类型、当地气候和病虫害水平。
基于来自卫星的大量结构化和非结构化数据、来自美国农业部的数字化农业数据、天气数据和作物产量记录，气候田间视图可以对农民的土地进行分析。它覆盖全球2.2亿英亩土地，其中1.1亿英亩位于美国，占其耕地总面积的12%。
许多驾车人士都熟悉Waze，这是一款汽车路线规划应用，它还能提醒驾驶员注意危险、超速陷阱和交通拥堵。该应用通过众包方式从全球1.3亿用户那里获取信息。其最新业务是拼车，利用实时数据匹配拥有相似通勤路线的用户。
Waze拥有大量以知识图谱形式呈现的信息，这些信息基于用户输入以及过去/实时交通模式的数据。这些数据是从其全球1.3亿驾车人士的众包用户群中收集而来的。然而，并非知识图谱中的所有内容都与特定时间和空间点的用户相关。Waze必须提取与用户情境最接近的图谱信息。现在，这些信息已准备好进行进一步分析。
FieldView 利用安装在农用车辆上的传感器获取的农场特定数据，根据现场地形、天气和地下水位等关键指标，为每位农民的土地提出几种可行的种植和施肥方案。
该技术配备产量管理软件，可计算入围各种方案的可能产量。
收获后，该技术计算每英亩土地的实际收益。它计算实际施肥量等投入，并根据财务和环境标准评估这些投入，以评估其整体绩效。
农民订阅 FieldView。通过优化农民的产量并降低他们的财务和环境成本，FieldView 保留了其订阅用户，并可能获得新的订阅用户。
Waze 根据各种关键标准生成各种路线。这些路线包括最短路线、最快路线、最低排放路线、免费路线，甚至还有避开主要高速公路的风景路线。
该应用程序根据用户目标推荐最佳路线。它会在行程中实时更新路线，并在途中根据交通状况的变化提供更好的替代方案。
用户反馈可以实时评估 Waze 的推荐。当应用程序的路线选择受到不可预见的交通拥堵或其他危险的影响时，驾驶员会同时报告。
Waze 主要通过在其推荐路线上宣传商店和服务来获得收入。它还通过拼车服务费获得收入。
4.1.2 化学——用于材料探索的图形网络

太阳能电池板、计算机芯片和电池等现代技术需要稳定且不会分解的无机晶体。材料探索图网络（GNoME）是一款用于发现新材料的人工智能工具。根据《自然》杂志的一篇论文，它已经发现了220万种新晶体。GNoME表示，这些发现包括38万种稳定的材料，这些材料可能为未来的技术提供动力。
GNoME以知识图谱的形式存储了大量关于晶体的信息。从已知晶体开始，GNoME必须缩小知识图谱中与初始晶体在语境上最接近的部分。
GNoME生成许多合成晶体配方，这些配方可能足够稳定，可用于计算机芯片、电池和太阳能电池板等技术。
国际数学奥林匹克可以说是世界上最负盛名、也是最艰难的大学预科数学竞赛。谷歌的 AlphaProof 和 AlphaGeometry AI 强强联手，
在奥林匹克竞赛中，成功解答了六道题目中的四道，这相当于银牌得主的成绩。至关重要的是，AI 能够解答呈现给人类学生的问题。
LLM将问题转化为符号形式，以便轻松映射到包含众多已知数学关系的知识图谱中。基于在此映射中，知识图谱中与问题背景最相关的部分被分离出来。
基于知识图谱中分离出来的这一部分，并以问题作为输入，LLM 生成针对所提问题的可能答案。
LEAN，一个演绎推理引擎，用于验证其候选解决方案列表。鉴于奥林匹克竞赛历史上参赛人数众多，检查每个解决方案将是一项艰巨的任务。因此，一个智能的
选择必须检查生成的晶体配方的准确性，并生成一个更短、更准确的晶体列表。
它使用数学模型来测试其提出的晶体是否真正稳定。然后，它将稳定的材料存储在数据库中，以改进其源材料，以供将来搜索。
GNoME 发现可以为科技行业提供装备的材料。每一次发现都会为下一轮学习提供信息，从而创造出一个能够自我传播的人工智能，并持续吸引投资。该项目采用了一种名为“蒙特卡洛树搜索”的搜索技术。该技术可以识别出正确概率最高的解决方案。
在这种情况下，由专家评判员进行人工评估。评估结果为二元对立：人工智能的最终答案要么正确，要么错误。数学中几乎没有细微差别！然而，人类评判员可能会对解决方案的优雅性和简洁性提出一些评论。
该项目没有经济回报。但它确实证明了复合人工智能的有效性——并且有可能迁移到其他行业和领域。
4.1.3 零售 - SAMVID

零售商和快递员之间的合同非常复杂。通常，合同会规定各种服务的折扣。对于人类分析师来说，识别和量化这些因素可能非常棘手且耗时。Samvid 的 AI 产品可以分析零售商和快递员之间签订的合同。
LLM 将合同转换为包含特定领域元数据的知识图谱。此元数据层的构建考虑了潜在的用户问题。
LLM 解释用户提出的自然语言问题，并生成一系列候选智能代理，这些代理带有相应的系统提示，这些提示可能能够回答所提出的问题。
LLM 通过将问题数据与合适的智能代理进行匹配来选择特定的智能代理。然后，该智能代理使用问题数据，并运用从基础到复杂的物流定价推理来回答问题。答案将返回给用户。这些示例有助于更好地理解常见决策任务中信息处理的四个阶段。
它们也让我们很好地了解了情境感知 AI 系统如何在每个阶段提供帮助。总的来说，它们通过两种方式提升价值。
首先，它们将各个阶段涉及的一些“繁重工作”自动化——例如 ClimateView 或 Samvid 示例中的情境化。这让用户可以腾出时间去做其他更有价值的任务。这些任务包括：专注于道路而不是费力地看地图、寻找更多客户，或者腾出时间对业务进行更具战略性的思考。
其次，情境感知型人工智能系统可以快速且不知疲倦地工作，例如 GNoME 或 AlphaGeometry 的示例。因此，它们可以发现并评估人类在疲劳、无聊或其他认知受限时可能错过的机会。事实上，在 GNoME 或 AlphaGeometry 这样的案例中，人工智能的耐力尤为宝贵，因为它们涉及组合搜索和评估，即综合考虑多种选项，而人类通常会觉得这令人恼火和疲惫。
参考资料

软件测试精品书籍文档下载持续更新 https://github.com/china-testing/python-testing-examples 请点赞，谢谢！
本文涉及的python测试开发库谢谢点赞！ https://github.com/china-testing/python_cn_resouce
python精品书籍下载 https://github.com/china-testing/python_cn_resouce/blob/main/python_good_books.md
Linux精品书籍下载 https://www.cnblogs.com/testing-/p/17438558.html
python八字排盘 https://github.com/china-testing/bazi
联系方式：钉ding或V信: pythontesting

4.2 任务剖析与人工智能失败

我们已通过成功实施的案例展示了情境感知人工智能系统的不同功能如何映射到决策任务的剖析结构中。
然而，并非所有人工智能项目都能蓬勃发展。这就引出了一个问题：失败的项目是否涉及与描述不同的任务剖析？还是这些案例是由于从剖析到任务的映射不匹配？在大多数情况下，我们认为是后者。当然，也存在许多组织层面的评估，实际结果会与部署人工智能之前的流程进行比较以计算人工智能系统解决方案节省的时间和/或成本。
人工智能供应商将从人工智能解决方案带来的成本节约或收入增长中获得一定比例的佣金。如果节省了时间，则获得一定比例的约定等价货币（例如，每节省一小时可获得 x 美元）。以及阻碍人工智能成功实施的技术陷阱。我们将在本书的第三部分中探讨这些问题。现在，让我们来分析一些值得注意的人工智能失败案例，并从任务解剖的角度找出其中的薄弱环节。
其中一个备受瞩目的案例，或许现在人工智能失败的一个略显滥用的例子是伪造引证。律师史蒂文·施瓦茨列举了ChatGPT提交给他的大量案例，包括马丁内斯诉达美航空案、米勒诉联合航空案以及德登遗产诉荷兰皇家航空案。问题在于，这些案例都不存在。施瓦茨被人工智能系统误导了。他告诉纽约一家法院，他不知道该机器人可以伪造案件。施瓦茨对ChatGPT缺陷的无知最终付出了高昂的代价。他、他的同事彼得·洛杜卡以及他们的律师事务所Levidow, Levidow & Oberman因伪造引证被罚款5000美元。在这个例子中，失败可以归因于我们任务剖析的选择步骤。 ChatGPT 背后的 Transformer 的工作原理是将不同的语言构建块组合起来，从而生成与提出的问题紧密匹配的新结果。然而，这只能确保答案与问题相比看起来不错，并不能保证答案在事实上准确无误。为了正确使用这样的系统，任何引用的案例都必须根据事实数据库进行验证。只能引用真实的案例。Schwartz 事件发生后引起了不小的轰动。然而，圣克拉拉大学临床法学院的 Linsey Krolik 仍然保持乐观。Krolik 认为，诸如基于律师提示的基本法律草案构建等后端流程，在未来五年内有望成功实施。正如我们将在第七章中讨论的那样，纠正此类问题相对简单，或许可以通过使用检索增强生成技术，并构建一个相关且全面的先例法律文件数据库来实现。有些人工智能失误的影响比施瓦茨如今臭名昭著的错误更为深远。研究人员发现，美国医疗保健系统中广泛使用的一种算法存在种族偏见。该算法将更健康的白人患者的风险级别分配给病情更重的黑人患者。因此，黑人患者获得额外护理的可能性低于病情同样严重的白人患者。该缺陷根植于算法本身，错误地将每位患者的医疗费用作为医疗保健需求的衡量标准。由于黑人患者的医疗支出低于病情类似的白人患者，该算法得出结论，黑人患者比具有相同健康风险状况的白人患者更健康（风险也更低）。在这个例子中，失败在于情境化。人工智能系统无法将种族差异视为支出数据偏见的来源。因此，它假设此类错误并不存在。
在线房地产公司 Zillow 的购房业务（即 iBuying）失败了，因为其人工智能系统预测房价的能力不如房主本人。这并非因为它使用的数据集不准确，而是因为该数据集的应用超出了其极限。历史的逐街价格数据忽略了对售价产生不成比例影响的关键变量：例如，房屋脏乱、有异味、内部布局不寻常导致买家望而却步，或者房屋装修过于精美。此外，这个问题持续了一段时间，给 Zillow 造成了巨额损失——尽管在这种情况下，房屋相对于其他房屋的购买价格较高，其评估起来相对容易。Zillow 的主要业务是将其购得的房屋进行小修小补后再进行转售。这些市场交易数据本应显示，该公司要么在维修上支出过高，要么以低于盈利所需的价格出售房屋。这是决策评估步骤的失败。
最后一个例子是，Samvid Inc. 的联合创始人兼首席执行官 Arun Rao 回忆起一位客户，该客户计划将所有采购流程外包给人工智能。该客户与一家大型科技公司合作，因此缺乏技术意识几乎是没有理由的。然而，一年过去了，很明显，鉴于 LLM 技术的现状，其目标是无法实现的。
该客户希望用作输入数据的采购文件范围差异很大。使用现成的 LLM 无法生成达到公司所需精度水平的答案。据估计，通过知识图谱构建适量的上下文并应用正确的隐私保护措施需要多年的时间。因此，客户不得不缩减其人工智能雄心。最终，它只是简单地自动化了常规流程，认为即使人工智能未能实现预期效果，也能将业务损失降至最低。这显然是决策过程中生成步骤的失败。使用本书中倡导的一些工具和技术来构建情境感知能力肯定会有所帮助，但公司需要评估自己是否做好了准备。我们将在第7章和第8章中讨论这个主题。这些示例说明了在尝试实施情境感知型人工智能之前，需要对业务任务中涉及的感知和推理机制有透彻的理解。
到目前为止，我们已经描述了决策任务的构成，并将其映射到成功的人工智能实现中，并通过几个示例强调了设计失败的点。在接下来的两章中，我们将以此框架为基础，来理解人与人之间的企业交互，并最终理解包含许多此类交互的市场。在此之前，我们先简要讨论如何将任务构成中的洞察映射到技术架构中。

4.3 从构成到技术架构

虽然上述关于任务构成和人工智能失败的讨论揭示了有待改进的领域，但我们需要针对情境感知型人工智能架构采取具体的行动步骤来纠正这些失败。
在第三章中，我们讨论了快速发展的情境感知技术栈，该技术栈可应用于感知和推理以完成任务。具体来说，我们讨论了构建更好的知识图谱如何提升感知能力，而创建更好的智能代理如何提升推理能力。这为我们提供了改进技术架构的路线图。
例如，在医疗保健偏见和采购外包的案例中，失败点与感知有关。因此，任何技术改进都必须专注于构建更好的知识图谱，影响医疗保健示例中的情境化和采购示例中的生成。
另一方面，在法律虚假引文和 Zillow 购房的案例中，失败点与推理有关。因此，任何技术改进都必须专注于创建更优的智能代理，影响法律示例中的选择和购房示例中的评估。因此，分析任务解剖结构为我们提供了人工智能技术开发的指南。在本书的第三部分，我们将进一步探讨情境感知人工智能技术与业务流程战略影响之间的映射关系。
4.4 小结

大多数组织决策路径都遵循一个共同的信息处理结构，该结构由四个步骤构成——情境化、生成、选择、评估。情境感知人工智能可以通过不同的方式改进每个步骤。
高管必须清晰地理解这些步骤在其业务流程中的具体体现，而不是仅仅从技术角度进行理解。这有助于识别情境感知人工智能系统中潜在的设计缺陷。
情境感知人工智能必须完全或部分地映射到业务流程中的决策要素。这种映射使我们能够发现人工智能实施中的薄弱环节，并有助于改进人工智能架构。知识图谱弥补了感知阶段的不足，而智能代理则在推理阶段提供帮助。

来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

账号		自动登录	找回密码
密码			立即注册

人工智能驱动企业：通过情境感知AI重塑组织4个人生产力

相关帖子

浏览过的版块

签约作者

人工智能驱动企业：通过情境感知AI重塑组织4个人生产力

相关帖子

相关推荐

浏览过的版块

签约作者