万字干货|一篇文章助你了解机器学习

投稿
APP
微信扫一扫获取更多

万字干货|一篇文章助你了解机器学习

陈绍冰

2022-12-01 20:42:06

图灵汇官网

前言

自从AlphaGo战胜李世石以来，人工智能（AI）迎来了新一轮的增长高峰。2018年，全球人工智能市场规模达到了73.5亿美元，各行各业几乎都被AI所渗透。各国对AI人才的需求日益增加。《中国人工智能发展报告2018》显示，中国已成为全球人工智能专利最多的国家，数量略高于美国和日本。此外，中国的人工智能企业数量位居全球第二，北京则是全球人工智能企业的聚集地。全球知名创投研究机构CB Insights评选出的100家最有前途的AI公司中，国内有六家企业入选，包括商汤科技、旷视科技和第四范式等。各大互联网公司纷纷建立自己的AI实验室，一方面利用AI技术挖掘用户数据，优化现有业务，另一方面探索新的应用场景，研发新产品。

一、机器学习建模实验室项目

笔者有幸参与了一个机器学习建模实验室项目，该项目的核心在于抽象机器学习建模流程，将机器学习建模过程组件化。用户可以在画布上灵活连接组件（算子），使非专家用户（不会写代码、不熟悉算法和调参的产品经理、市场运营、行政财务等职场人士）能够快速搭建机器学习模型，实现业务预测，大大降低了机器学习应用的门槛。

通过近十个月的学习和实践，笔者对机器学习有了初步的理解。本文将通过大量案例和通俗易懂的语言，讲述机器学习建模的逻辑和应用场景，让非数据科学专业的职场人士也能快速了解机器学习是什么，能做什么，以及如何使用。

二、关于AI的几个误区

1、只有科技公司才能应用AI技术？

AI技术的应用并不限于科技公司。各行各业都可以利用AI技术优化现有服务流程，提升效率。例如：

会员智能化应用：基于历史数据进行精准营销，个性化优惠券下发，流失预警，新会员转化路径配置等。
商品智能化应用：预测销售量、库存量、订单量，关联销售，优化供应链，预测市场容量，新品定价，设定折扣策略和作弊检测。
异常分析：订单异常分析，用户异常分析，机械故障预测，羊毛党分析，动态预警分析等。

2、使用AI技术必须掌握数学和Python？

AI技术的应用并不需要掌握复杂的数学和编程技能。如今有许多组件建模平台，可以通过简单拖拽的方式进行建模，无需编写代码。复杂的数学公式也被封装成算子组件。例如，亚马逊AWS、微软AZURE、R2.ai等国外平台，以及国内的阿里云PAI、第四范式的先知平台等，都是类似的工具。此外，深度学习建模过程也被封装成组件化建模。例如，国外的DeepCognition和国内即将上线的阿里云PAI新版本都支持深度学习组件化建模。如果觉得组件化仍显复杂，自动化建模也是一个趋势。例如，国外的DataRobot就是一个典型的例子，只需上传带有标签的CSV数据，选择标签并点击开始，系统会自动从数千开源模型中选择100个模型进行自动化调参训练，选出最优模型，并生成易于理解的专业报告。