爬虫里我们常说的 ‘风控’ 到底是个什么东西

以前看群里大佬总说风控,我也一直不明白,今天在穿甲兵社区看到了某位大佬的回复,才明白风控到底什么意思

原话:风控听起来有点虚,换个方式讲可能清晰一点,你可以粗略地理解为反欺诈的技术手段。互联网领域中广义的欺诈指的是刷单、恶意注册、伪造账户参与活动等等,反欺诈就是反这些;爬虫领域的反欺诈(这里对应你提到的风控),就是针对爬虫特征设计的一些技术手段。 风控流程大体是这样的:获取终端(账户信息/IP/网页指纹/安卓指纹/某个设定的值(例如 _sign=ejy092jhi))特征和行为信息(例如请求频次/请求路径/固定行为等)在后端进行分析甚至是风险分类(建模后使用深度学习算法进行风险分类),从而确定此人(账户信息/IP/网页指纹/安卓指纹/某个设定的值)的风险等级,进而决定返回正确数据(正常请求)、假数据(普通蜜罐)还是恶意数据(攻击型蜜罐)。 风控一般过程简单理解为:终端风控-后端分析-形成模型。它们是互相作的,终端的信息传输到后端,后端按照一定的算法和规则(或者预先设定的模型)进行分析,将分析结果作用到模型上,一方面是算出风险等级,一方面是完善模型数据,这样就形成了一个环路。 总结一下:爬虫领域中说的风控就是针对爬虫展开的反欺诈,它的大体逻辑和流程与 it 行业内的反欺诈很接近。听懂了吗

你可能感兴趣的:(爬虫,爬虫,python)