将人工智能/机器学习应用于业务问题

将人工智能/机器学习应用于业务问题

Artificial Intelligence / Machine Learning

近年来,我们看到人工智能研究领域出现在电视、广播和互联网的几个新闻节目中。大数据、数据科学、机器学习和深度学习等词汇迅速融入商业世界的词汇中。

考虑到许多公司希望将这些技术应用到他们的业务中,我选择了 3 个技巧,供管理人员和高管开始在他们的公司中应用机器学习并提高他们成功的机会。

提示 1:将错误的期望与现实区分开来。

有些人坚持机器学习解决方案就像一颗灵丹妙药:你有数据,技术人员只需要你动手,神奇的是,公司很快就会有,例如,关于新产品的准确答案,洞察由于一些神奇的算法(一组指令),客户行为和各种业务解决方案会自动进行。

其他人,宣传一些已经上市一段时间的产品或服务,但它被重新命名为现在有人工智能的解决方案,因为由于对该主题的高需求和缺乏更准确的信息,它使得用旧产品卖更多,只是靠新标签。例如,软件在内部得出一些结果来计算一些算术平均值,但现在使用线性回归。

事实是,要成功应用机器学习,不仅需要具备如何从数据中提取有用模式的技术知识,而且主要是如何制定要解决的良好业务问题,此外还要在公司中创造一种文化维护一个完整的数据护理周期,从正确的选择和收集到结果的可用性,重点关注公司战略的实际价值,通常由其经理和客户的满意度来衡量。

为此,通常需要 3 个关键知识:

  1. 深入了解公司的商业模式和产品/服务;
  2. 数据分析技术和模式识别算法;
  3. 信息技术知识。

请注意,这些项目很难在一个人身上找到,因为它们是不同的角色,需要团队合作的文化。如果公司没有强大的协同作用来使业务经理与科学家保持一致,并提供最少的技术 IT 基础设施以使项目可行,那么拥有市场上最好的数据科学家就没有什么意义,除了冒险的意愿。

提示 2:垃圾进,垃圾出!

机器学习解决方案的质量与数据的质量直接相关。由于结果是基于对它们的假定了解,因此只有当解决方案(模型、算法……)能够忠实地概括业务现实时,才会发生这种情况。毫无疑问,使用机器学习最令人兴奋的部分是创建模型、执行算法和显示结果的部分,但这完全取决于作为这些任务输入的数据的质量和相关性。也就是做好基础。

事实上,机器学习项目的大部分时间都花在了组织、转换和清理数据上。需要注意的一些项目:

  1. 数据真的与解决公司问题相关吗?例如,产品推荐解决方案中的收入数据;
  2. 数据将来自哪里以及如何来?是否有解决方案需要的可用性和更新保证?示例:实时、每日、每周、每月、自动检索或手动提取的数据;
  3. 数据是否包含许多空白或空字段?应用值的平均值/中值/众数或删除缺少数据的记录?
  4. 输入的值是否可靠?示例:在销售点,客户 ID 字段大多是标准数字,例如 0000001。
  5. 数据是否符合解决方案所需的格式并且是最新的?示例:我们有一个人的年龄,但它是指他在商店注册的时间。

无论数据是像 Excel 电子表格或数据库表那样结构化,还是像图像、视频和音频那样非结构化;或者它们是从互联网自动获取还是手动提取。重要的是它们与业务问题的解决(通常是增加收入或减少开支)相关,并且它们是干净的并且以针对问题的最佳方式进行转换,因为如果垃圾进来,垃圾肯定会出来,还。没有回收利用。

Tip 3:学会处理这类项目的不确定性

当我们处理软件开发项目时,我们已经习惯了一种现实。在大多数情况下,以待开发需求的形式,有明确定义的时间表、成本和范围等特性。在出现问题的情况下,通过增加人员、增加预算、购买更好的资源、加班、优先范围等调整,可以有效地解决问题。

在机器学习项目的情况下,可能会有一些非常令人不快的意外,因为构思和管理它们的方式与通常的方式略有不同。这些差异之一是处理项目不确定性的方式。在开始机器学习项目时,不可能保证完全准确的结果,就像我们在软件开发项目中倾向于做的那样。

想象一个通过农场摄像机拍摄的图像识别野生动物的项目。例如,当动物接近相机时,会创建一张照片,机器学习软件会将动物分类为鸡、牛或狼。根据软件检测到的动物类型,必须采取不同的操作,例如数鸡或在检测到狼时发出警报。最初的问题可能是:动物分类的正确率是多少?

会是 40%、75% 还是 90%?需要多少张图像才能获得良好的准确性?一百?五百?千?万?每只动物两百只?当新型动物出现时,如何纳入?这种包含对新结果有什么影响?会不会有很多动物被错误识别?错误地检测到狼有什么影响?

在开始机器学习项目之前,我们必须始终明确定义成功指标,例如达到 80% 的准确率,并且只容忍 10% 的错误之类的。但是,不能肯定地说一定会达到一定的成功标准。只有通过经验,我们才能估计结果。在某些情况下,如果技术团队没有经验并且没有明确风险,根据结果,项目经理和发起人可能会感到沮丧。在创新中,风险和不确定性是定义此类项目的因素。

没有风险?没有创新!否则就不是创新,只是例行公事。好消息是,如果机器学习项目没有达到预期的精度水平,有几种技术可以优化结果:如何更改算法、调整参数和超参数、尝试减少偏差和方差。因此,拥有经验丰富的专业人员,或者从简单的项目开始并随着时间的推移获得专业知识总是很重要的。

但有时,唯一真正有效的解决方案是拥有比我们迄今为止计划的更多的数据量。因此,重要的是要学习如何处理该项目规划的不确定性,并以透明的方式与所有相关方进行沟通。或者我们会冒着听到类似这样的对话的风险:——没有得到必要的精确度有什么问题?我们需要解决它!您可以再购买大约 5 台由公

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/35188/30001400

posted @ 2022-09-14 00:30  哈哈哈来了啊啊啊  阅读(20)  评论(0编辑  收藏  举报