机器学习

     AI(ArtificialIntelligence)时代,机器学习(Machine Learning)是AI的一个巨大分之,我们的生活学习都离不开机器学习,那么什么是机器学习?机器学习能解决什么问题?常用算法和框架有哪些?

一、什么是机器学习?

     利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策中。例如公司下个季度业绩预测。机器学习主要依靠的就是规律,而规律的得出又离不开大量的数据挖掘工作。

     从大量数据中通过一些特定的算法找出某个规律,最后把规律运用到决策中,最终规律落地也不是通过程序员根据这个规律进行各种if else 判断,而是利用机器学习一套完备的步骤完成。

二、机器学习是如何找到这个规律的?

传统的找规律 VS 机器学习中的找规律    

    从大量历史数据中找出一定规律的活儿千百年来就在进行,数学中的统计学就是致力于找出各种数据中的各种规律。传统的找规律受限于运算能力的限制,统计学从数据中找规律就主要利用抽样等方法,先抽样做统计得出结论再回归做假设检验,验证这个结论的正确性。

    而现在找规律就可直接通过全量的数据直接进行分析,寻找模型的过程就类似于得到某个数学函数,这个函数能最大化的接近大量数据中所体现出来的规律。

三、机器学习有哪些优势?

     1、用数据代替专家

     2、经济驱动,数据变现,将大量历史数据变得有价值

四、机器学习的两种模式

     1、离线机器学习

     比如在某天晚上定一个定时任务,将今天之前的所有历史数据根据某个算法跑一遍,训练出一个新的模型,第二天使用这个新的模型处理业务。周而复始,每天都会生成一个新的模型。

     离线机器学习存在的问题,像现在各大电商网站节日式的销售,在这一天其实消费者的消费模式会跟之前有很大的不一样,利用之前训练出的模型对消费者进行推荐时,可能今天他的购买目标并非日常经常购买的商品。所以使用离线学习方式训练出的模型就不再适用于该用户在节日当天的消费。

     2、在线机器学习  

     这时就需要使用在线机器学习,实时的根据用户当天的消费行为训练出模型来。用户来了一个订单、浏览、访问就实时的调整模型。

五、机器学习的典型应用

1、购物篮分析 

     看看在购物篮中哪些商品是被同时购买的,主要使用关联规则算法(啤酒+尿片的关联营销)

2、用户细分精准营销

     将用户分为不同用户群,例如移动运营商的动感地带针对学生、全球通针对商务人群、神州行针对务工人员;根据客户群的特点进行细分。那么如何确定的这几类用户人群?就是通过用户的消费数据,通过聚类机器学习算法,把用户进行分类,得出各类用户的消费特征。 

3、垃圾邮件识别

     朴素贝叶斯算法

4、信用卡欺诈

     信用的风险识别,用户的还款能力是否匹配他的消费能力,使用决策树进行

5、互联网广告

     CTR预估对用户的点击率预估,对于你搜索的关键字下每一个搜索结果进行预估, 第一条结果肯定你的点击率最高例如0.8,第二条0.7进行结果排序。预测你最可能点的那个条链接给你排放到第一。

6、推荐系统

     协同过滤算法,例如”经常一起购买“;”购买过此商品的用户同时也购买了“进行预测你可能会购买什么东西,进行一个预判,提高销量。

7、自然语言处理

     自然语言处理属于机器学习的一个应用方向,典型的应用如情感分析根据用户发表的文字、评论来判断用户是否是一个积极的用户;实体识别将一篇文章中所涉及到的人名、地名、企业等信息提取出来进行统计.

8、深度学习

     图像识别,例如一张照片,计算机自动识别出照片中是猫是狗。

     还有其他如语音识别(手机语音解锁、语音搜索),人脸识别(支付宝刷脸、各公司签到系统),自动驾驶,手势控制(Tom猫)。

你可能感兴趣的:(机器学习)