1.本发明涉及移动通信反欺诈领域,具体而言,涉及一种诈骗号码的确 定方法及装置。
背景技术:2.相关技术中,随着移动通信技术的不断发展,移动终端例如手机、ipad 等也变得越来越普及。但是,在移动通信技术给人们的生活带来便利的同 时,也造成人们的私人信息泄露等问题,造成较多的诈骗案件。
3.相关技术中存在反诈手段识别诈骗电话的精度不高的技术问题。针对相关技术中提到的上述问题,目前尚未提出有效的解决方案。
技术实现要素:4.本发明的主要目的在于提供一种诈骗号码的确定方法及装置,以解决 相关技术中对诈骗号码进行检测输出,提升用户诈骗场景识别精准度同时 保证数据的覆盖度的问题。
5.为了实现上述目的,根据本发明的一个方面,提供了一种诈骗号码的 确定方法。该发明包括:确定诈骗分子的画像,并依据诈骗分子的画像确 定多个第一筛查特征;获取b域数据,并通过多个第一筛查特征对b域数 据进行初步筛选以得到第一目标数据,其中,b域数据包含多个待确定是 否为诈骗号码的号码对应的数据;将第一目标数据输入至反诈模型,并控 制反诈模型输出诈骗话单以及诈骗话单对应的诈骗事件。
6.进一步地,确定诈骗分子的画像,包括:获取正样本数据,正样本数 据包括多个诈骗电话对应的数据;依据大数据分析对正样本数据进行分析 以确定多个诈骗分子的多个画像,其中,诈骗分子的画像至少包括:诈骗 分子使用的电话号码信息、诈骗分子的身份信息、诈骗分子的终端信息、 终端对应的基站信息、电话号码对应的套餐实用信息、电话号码对应的消 费信息。
7.进一步地,依据诈骗分子的画像确定多个第一筛查特征,包括:依据 诈骗分子的画像,确定诈骗人员对应的行为数据;分析行为数据,并确定 行为数据对应的多个特征;将多个特征确定为多个第一筛查特征,其中, 每个第一筛查特征关联一个阈值范围。
8.进一步地,获取b域数据,并通过多个第一筛查特征对b域数据进行 初步筛选以得到第一目标数据,包括:获取b域数据中包含的电话号码对 应的行为数据,以及行为数据对应的多个特征;确定行为数据的多个特征 对应的数值,是否均不处于与多个特征对应的多个第一筛查特征相关联的 多个阈值范围内;将特征对应的数值均不处于对应的多个阈值范围内的电 话号码数据剔除,并将剩余数据确定为第一目标数据。
9.进一步地,在将第一目标数据输入至反诈模型,并控制反诈模型输出 诈骗话单以及诈骗话单对应的诈骗事件之前,该方法包括:获取正样本数 据以及负样本数据,负样本数据包括多个不为诈骗电话对应的数据;依据 诈骗分子的画像,确定第二筛查特征,其中,
第二筛查特征的数量大于第 一筛查特征的数量;依据正样本数据以及负样本数据以及第二筛查特征, 构建反诈模型。
10.进一步地,控制反诈模型输出诈骗话单以及诈骗话单对应的诈骗事 件,包括:控制反诈模型对诈骗话单进行分析,以确定诈骗话单中包含的 号码;确定号码对应的通话信息,依据通话信息确定诈骗事件。
11.进一步地,在将第一目标数据输入至反诈模型,并控制反诈模型输出 诈骗话单以及诈骗话单对应的诈骗事件之后,该方法包括:依据诈骗事件, 确定诈骗事件对应的受害人;基于诈骗事件生成提醒,并将提醒发送至受 害人对应的通信终端上。
12.为了实现上述目的,根据本发明的另一方面,提供了一种诈骗号码的 确定装置。该装置包括:第一确定单元,确定诈骗分子的画像,并依据诈 骗分子的画像确定多个第一筛查特征;第一获取单元,获取b域数据,并 通过多个第一筛查特征对b域数据进行初步筛选以得到第一目标数据,其 中,b域数据包含多个待确定是否为诈骗号码的号码对应的数据;控制单 元,将第一目标数据输入至反诈模型,并控制反诈模型输出诈骗话单以及 诈骗话单对应的诈骗事件。
13.为了实现上述目的,根据本技术的另一方面,提供了一种计算机可读 存储介质,该计算机可读存储介质包括存储的程序,其中,该程序执行上 述任意一项的一种诈骗号码的确定方法。
14.为了实现上述目的,根据本技术的另一方面,提供了一种处理器,处 理器用于运行程序,其中,该程序执行上述任意一项的一种诈骗号码的确 定方法。
15.通过本发明,采用以下步骤:确定诈骗分子的画像,并依据诈骗分子 的画像确定多个第一筛查特征;获取b域数据,并通过多个第一筛查特征 对b域数据进行初步筛选以得到第一目标数据,其中,b域数据包含多个 待确定是否为诈骗号码的号码对应的数据;将第一目标数据输入至反诈模 型,并控制反诈模型输出诈骗话单以及诈骗话单对应的诈骗事件,解决了 相关技术中对诈骗号码进行检测输出,提升用户诈骗场景识别精准度同时 保证数据的覆盖度的问题,进而达到了减少用户损失以及及时有效的打击 移动网络诈骗行为的效果。
附图说明
16.构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明 的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限 定。在附图中:
17.图1是根据本发明实施例提供的一种诈骗号码的确定方法的流程图 一;
18.图2是根据本发明实施例提供的一种诈骗号码的确定方法的流程图 二;
19.图3是根据本发明实施例提供的正负样本在当天最活跃小时的总时长 的特征分布的示意图;
20.图4是根据本发明实施例提供的正负样本在手机号开户天数的特征分 布的示意图;
21.图5是根据本发明实施例提供的正负样本在当天主叫的最大时长的特 征分布的示意图;
22.图6是根据本发明实施例提供的正负样本在当天同一lac_ci基站下 对端号码的
均值的特征分布的示意图;
23.图7是根据本发明实施例提供的正负样本在8天内通话所在小时的标 准差的特征分布的示意图;
24.图8是根据本发明实施例提供的正负样本在8天里日均总时长的特征 分布的示意图;
25.图9是根据本发明实施例提供的一种诈骗号码的确定装置的示意图。
具体实施方式
26.需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的 特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
27.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明 实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述, 显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施 例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动 前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
28.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语
ꢀ“
第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序 或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里 描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何 变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过 程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而 是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其 它步骤或单元。
29.根据本发明的实施例,提供了一种诈骗号码的确定方法。
30.图1是根据本发明实施例的一种诈骗号码的确定方法的流程图一。如 图1所示,该发明包括以下步骤:
31.步骤s101,确定诈骗分子的画像,并依据诈骗分子的画像确定多个第 一筛查特征。
32.上述地,首先确定诈骗分子的画像,再依据诈骗分子的画像确定多个 用于筛查电话号码的第一筛查特征。
33.步骤s102,获取b域数据,并通过多个第一筛查特征对b域数据进行 初步筛选以得到第一目标数据,其中,b域数据包含多个待确定是否为诈 骗号码的号码对应的数据。
34.上述地,b域数据为全网的电话数据,全网的电话数据通过第一筛查 特征进行筛查,完全不符合条件的电话数据剔除出去,得到剩下的数据为 第一目标数据。
35.步骤s103,将第一目标数据输入至反诈模型,并控制反诈模型输出诈 骗话单以及诈骗话单对应的诈骗事件。
36.上述地,本技术提供了一种反诈模型,将第一目标数据输入反诈模型 中输出诈骗话单以及诈骗话单对应的诈骗事件。
37.通过上述方法,如图2所示,图2是根据本发明实施例提供的一种诈 骗号码的确定方法的流程图二,本技术通过对大量历史举报案例和投诉案 例进行大数据特征分析和基础行为画像,计算诈骗行为数据的单变量异常 阈值,使用这些阈值排除正常号码,对话单
数据的诈骗号码进行检测输出, 有效提升用户诈骗场景识别精准度同时保证对数据的覆盖度,通过特征扩 展,选择有效特征配合后筛条件,构建反诈模型,快速检出涉诈号码,分 析效率高、覆盖数据广、占用资源少,有效的对潜在受害人进行风险提示 等处理,从而减少受害人损失以及及时有效的打击移动网络诈骗行为。
38.本技术相较于依据号码语音模板进行识别的方案,无法律风险,减少 语音文件文本转写及分析所需要的大量计算资源,降低资源投入,利用大 数据特征分析技术,利用海量数据分析整理出诈骗分子的画像并进行特征 扩展,选择有效特征配合后筛条件,构建反诈模型,准确检出涉诈号码。
39.在一种可选的实例中,确定诈骗分子的画像,包括:获取正样本数据, 正样本数据包括多个诈骗电话对应的数据;依据大数据分析对正样本数据 进行分析以确定多个诈骗分子的多个画像,其中,诈骗分子的画像至少包 括:诈骗分子使用的电话号码信息、诈骗分子的身份信息、诈骗分子的终 端信息、终端对应的基站信息、电话号码对应的套餐实用信息、电话号码 对应的消费信息。
40.上述地,正样本数据为根据用户提供的警情报案涉及的诈骗电话号码 和12321举报数据提取到的诈骗号码,选取其被报案日的历史前7天及当 天数据经初筛剩余的号码作为初始正样本数据,剔除以短号等特殊号码进 行通话的号码,例如,12361投诉号码,公安通报号码等,经过初筛条件 的为正样本数据,由于正样本数据过少,样本不均衡,本技术提供的一种 实施例中采取过量采样方法,将正样本数据复制为3倍,得到144个正样 本数据。通过大数据分析对正样本数据进行分析以确定多个诈骗分子的多 个画像,减少正负样本数据不均衡对后续建模带来的影响,其中,多个诈 骗分子的多个画像至少包括:诈骗分子使用的电话号码信息、诈骗分子的 身份信息、诈骗分子的终端信息、终端对应的基站信息、电话号码对应的 套餐实用信息、电话号码对应的消费信息。
41.在一种可选的实例中,依据诈骗分子的画像确定多个第一筛查特征, 包括:依据诈骗分子的画像,确定诈骗人员对应的行为数据;分析行为数 据,并确定行为数据对应的多个特征;将多个特征确定为多个第一筛查特 征,其中,每个第一筛查特征关联一个阈值范围。
42.上述地,在本技术提供的一个实施例中,诈骗人员对应的行为数据的 多个特征至少包括手机号开户天数、当天平均主叫时长、当天被叫最大时 长、当天主叫次数、当天主叫同一归属地的号码比例、当天主叫同一所在 地的号码比例、8天内没有被叫常用联系人、8天内总话费小于134元、8 天内0点到7点没有通话等,其中,每个筛查特征关联的阈值范围分别为: 1)本端为手机号开户天数小于等于440天;2)当天平均主叫时长小于250 秒;3)当天被叫最大时长小于497秒;4)当天主叫次数大于3次;5)当天 主叫同一归属地的号码比例小于0.3;6)当天主叫同一所在地的号码比例 小于0.08;7)8天内没有被叫常用联系人;8)8天内总话费小于134元;9) 8天内0点到7点没有通话。
43.在一种可选的实例中,获取b域数据,并通过多个第一筛查特征对b 域数据进行初步筛选以得到第一目标数据,包括:获取b域数据中包含的 电话号码对应的行为数据,以及行为数据对应的多个特征;确定行为数据 的多个特征对应的数值,是否均不处于与多个特征对应的多个第一筛查特 征相关联的多个阈值范围内;将特征对应的数值均不处于对应的多个阈值 范围内的电话号码数据剔除,并将剩余数据确定为第一目标数据。
44.上述地,b域数据中的包含的电话号码对应的行为数据有多个特征, 特征包括手机号开户天数、当天平均主叫时长等信息,如果电话号码对应 的行为数据的多个特征对应的数值均不在第一筛查数据对应的特征的阈 值范围内的话,确定电话号码不是涉诈号码,为正常电话,剔除即可,剩 余电话号码数据确定为第一目标数据。
45.在一种可选的实例中,在将第一目标数据输入至反诈模型,并控制反 诈模型输出诈骗话单以及诈骗话单对应的诈骗事件之前,该方法包括:获 取正样本数据以及负样本数据,负样本数据包括多个不为诈骗电话对应的 数据;依据诈骗分子的画像,确定第二筛查特征,其中,第二筛查特征的 数量大于第一筛查特征的数量;依据正样本数据以及负样本数据以及第二 筛查特征,构建反诈模型。
46.上述地,依据正样本数据以及负样本数据以及第二筛查特征,构建反 诈模型。负样本数据由随机选取话单数据,通过初筛的号码查询对应的网 络标签,去除诈骗标签剩余的样本,经过初筛及过滤网络标签最终得到的。 返诈模型中还包括多个第二筛查特征,数据输入模型后,通过第二筛查特 征对数据进行进一步筛查,剔除以短号等特殊号码通话的号码,例如, 12361投诉号码,公安通报号码等。
47.在一种可选的实例中,控制反诈模型输出诈骗话单以及诈骗话单对应 的诈骗事件,包括:控制反诈模型对诈骗话单进行分析,以确定诈骗话单 中包含的号码;确定号码对应的通话信息,依据通话信息确定诈骗事件。
48.上述地,利用对诈骗话单进行分析得到诈骗话单中包含的号码,依据 号码对应的通话信息确定为诈骗事件,其中,通话信息包括通话时长,通 话对象的姓名等。
49.在一种可选的实例中,在将第一目标数据输入至反诈模型,并控制反 诈模型输出诈骗话单以及诈骗话单对应的诈骗事件之后,该方法包括:依 据诈骗事件,确定诈骗事件对应的受害人;基于诈骗事件生成提醒,并将 提醒发送至受害人对应的通信终端上。
50.上述地,确认有人受骗后,反诈模型将会基于诈骗事件生成提醒,将 提醒以短信或电话的形式打到受骗人的手机上或者其他通信终端上。
51.在本技术提供的另一种可选的实例中,以金融类诈骗场景的报案案例 进行多维度的数据分析,通过特征的相关系数热力分析如下:大部分特征 的相关性都特别低,部分同一类型的聚合特征具有相对较强的相关性,以 及自身多天的统计特征的分布会有较强的相关性,如8天内每日lac_ci 个数的下四分位数和8天内每日lac_ci个数的中位数。在这个场景下, 分类的最重要的特征是:当天最活跃小时的总时长、开户天数、当天主叫 的最大时长、当天单个号码的最长总时长、当天同一lac_ci下对端号码 的均值、8天内通话所在小时的标准差、8天里日均总时长。以下对重要 特征的正负样本分布进行展示:
52.如图3所示,图3是根据本发明实施例提供的正负样本在当天最活跃 小时的总时长的特征分布的示意图,大部分正常号码当天最活跃小时的总 时长都是低于500秒的,对于正常号码来说当天最活跃小时的总时长大于 1000秒就已经算是异常了,诈骗号码则刚好相反,当天最活跃小时的总时 长大多是大于1000秒的。
53.如图4所示,图4是根据本发明实施例提供的正负样本在开户天数的 特征分布的示意图,可知大部分的诈骗号码开户天数都短,大多都是40 天以内,正常号码的表现则相反,开户天数的分布比较离散,并且相对诈 骗号码来说,正常号码的开户天数较长。
54.如图5所示,图5是根据本发明实施例提供的正负样本在当天主叫的 最大时长的
特征分布的示意图,大部分诈骗号码当天最大时长都在400秒 以上,而对于正常号码来说当天主叫的最大时长大多集中在300秒以下。 正负样本也有较为显著的差别,大部分诈骗号码当天都会和某一号码有较 长时间通话,而大多正常号码和每个对端的通话总时长都是较短的。
55.如图,6所示,图6是根据本发明实施例提供的正负样本在当天同一 lac_ci基站下对端号码的均值的特征分布的示意图,正负样本在这个特征 上表现的较为相似,但是骗子号码在这个特征上的分布相对于正常号码来 说更离散一些。主要原因可能是因为正常用户的活动范围相对较大,相对 高频类骗子的频次也较低。
56.反诈模型检测:反诈模型上线后,对于b域数据话单进行骗子检测, 添加后筛:如对套餐价值,还有交叉通话行为进行限制。
57.如图7所示,图7是根据本发明实施例提供的正负样本在8天内通话 所在小时的标准差的特征分布的示意图,诈骗号码在这个特征上的表现相 对与正常号码更离散,但是大部分诈骗号码8天内通话所在小时的标准差 都比较低,说明骗子每天活跃小时数都比较相近
58.如图8所示,图8是根据本发明实施例提供的正负样本在8天里日均 总时长的特征分布的示意图,诈骗号码8天里日均总时长相对较长大多是 高于1500秒的。正常号码则相反,大多数小于1000秒的。
59.深浅度判断:基于当天骗子与受害人通长时长进行诈骗事件深浅度区 分,诈骗事件输出:输出诈骗事件和详情话单。
60.本发明实施例提供的一种诈骗号码的确定方法,通过确定诈骗分子的 画像,并依据诈骗分子的画像确定多个第一筛查特征;获取b域数据,并 通过多个第一筛查特征对b域数据进行初步筛选以得到第一目标数据,其 中,b域数据包含多个待确定是否为诈骗号码的号码对应的数据;将第一 目标数据输入至反诈模型,并控制反诈模型输出诈骗话单以及诈骗话单对 应的诈骗事件,解决了相关技术中对诈骗号码进行检测输出,提升用户诈 骗场景识别精准度同时保证数据的覆盖度的问题,进而达到了减少用户损 失以及及时有效的打击移动网络诈骗行为的效果。
61.需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可 执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序, 但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
62.本发明实施例还提供了一种诈骗号码的确定装置,需要说明的是,本 发明实施例的一种诈骗号码的确定装置可以用于执行本发明实施例所提 供的用于一种诈骗号码的确定方法。以下对本发明实施例提供的一种诈骗 号码的确定装置进行介绍。
63.图9是根据本发明实施例的一种诈骗号码的确定装置的示意图。如图 9所示,该装置包括:第一确定单元901,确定诈骗分子的画像,并依据 诈骗分子的画像确定多个第一筛查特征;第一获取单元902,获取b域数 据,并通过多个第一筛查特征对b域数据进行初步筛选以得到第一目标数 据,其中,b域数据包含多个待确定是否为诈骗号码的号码对应的数据; 控制单元903,将第一目标数据输入至反诈模型,并控制反诈模型输出诈 骗话单以及诈骗话单对应的诈骗事件。
64.在一种可选的实例中,第一确定单元901,包括:第一获取子单元, 获取正样本数
据,正样本数据包括多个诈骗电话对应的数据;分析子单元, 依据大数据分析对正样本数据进行分析以确定多个诈骗分子的多个画像, 其中,诈骗分子的画像至少包括:诈骗分子使用的电话号码信息、诈骗分 子的身份信息、诈骗分子的终端信息、终端对应的基站信息、电话号码对 应的套餐实用信息、电话号码对应的消费信息。
65.在一种可选的实例中,第一确定单元901,包括:第一确定子单元, 依据诈骗分子的画像,确定诈骗人员对应的行为数据;第二确定子单元, 分析行为数据,并确定行为数据对应的多个特征;第三确定子单元,将多 个特征确定为多个第一筛查特征,其中,每个第一筛查特征关联一个阈值 范围。
66.在一种可选的实例中,第一获取单元902,包括:第二获取子单元, 获取b域数据中包含的电话号码对应的行为数据,以及行为数据对应的多 个特征;第四确定子单元,确定行为数据的多个特征对应的数值,是否均 不处于与多个特征对应的多个第一筛查特征相关联的多个阈值范围内;第 五确定子单元,将特征对应的数值均不处于对应的多个阈值范围内的电话 号码数据剔除,并将剩余数据确定为第一目标数据。
67.在一种可选的实例中,该装置包括:第二获取单元,在将第一目标数 据输入至反诈模型,并控制反诈模型输出诈骗话单以及诈骗话单对应的诈 骗事件之前,获取正样本数据以及负样本数据,负样本数据包括多个不为 诈骗电话对应的数据;第二确定单元,依据诈骗分子的画像,确定第二筛 查特征,其中,第二筛查特征的数量大于第一筛查特征的数量;构建单元, 依据正样本数据以及负样本数据以及第二筛查特征,构建反诈模型。
68.在一种可选的实例中,控制单元903,包括:控制子单元,控制反诈 模型对诈骗话单进行分析,以确定诈骗话单中包含的号码;第六确定子单 元,确定号码对应的通话信息,依据通话信息确定诈骗事件。
69.在一种可选的实例中,该装置包括:第三确定单元,在将第一目标数 据输入至反诈模型,并控制反诈模型输出诈骗话单以及诈骗话单对应的诈 骗事件之后,依据诈骗事件,确定诈骗事件对应的受害人;发送单元,基 于诈骗事件生成提醒,并将提醒发送至受害人对应的通信终端上。
70.本发明实施例提供的一种诈骗号码的确定装置,通过确定诈骗分子的 画像,并依据诈骗分子的画像确定多个第一筛查特征;获取b域数据,并 通过多个第一筛查特征对b域数据进行初步筛选以得到第一目标数据,其 中,b域数据包含多个待确定是否为诈骗号码的号码对应的数据;将第一 目标数据输入至反诈模型,并控制反诈模型输出诈骗话单以及诈骗话单对 应的诈骗事件,解决了相关技术中对诈骗号码进行检测输出,提升用户诈 骗场景识别精准度同时保证数据的覆盖度的问题,进而达到了减少用户损 失以及及时有效的打击移动网络诈骗行为的效果。
71.一种诈骗号码的确定装置包括处理器和存储器,上述第一确定单元 901等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的 上述程序单元来实现相应的功能。
72.处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可 以设置一个或以上,通过调整内核参数来解决相关技术中对诈骗号码进行 检测输出,提升用户诈骗场景识别精准度同时保证数据的覆盖度的问题。
73.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储 器(ram)
和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram),存储器包括至少一个存储芯片。
74.本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理 器执行时实现所述一种诈骗号码的确定方法。
75.本发明实施例提供了一种处理器,所述处理器用于运行程序,其中, 所述程序运行时执行所述一种诈骗号码的确定方法。
76.本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存 储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:确 定诈骗分子的画像,并依据诈骗分子的画像确定多个第一筛查特征;获取 b域数据,并通过多个第一筛查特征对b域数据进行初步筛选以得到第一 目标数据,其中,b域数据包含多个待确定是否为诈骗号码的号码对应的 数据;将第一目标数据输入至反诈模型,并控制反诈模型输出诈骗话单以 及诈骗话单对应的诈骗事件。
77.在一种可选的实例中,确定诈骗分子的画像,包括:获取正样本数据, 正样本数据包括多个诈骗电话对应的数据;依据大数据分析对正样本数据 进行分析以确定多个诈骗分子的多个画像,其中,诈骗分子的画像至少包 括:诈骗分子使用的电话号码信息、诈骗分子的身份信息、诈骗分子的终 端信息、终端对应的基站信息、电话号码对应的套餐实用信息、电话号码 对应的消费信息。
78.在一种可选的实例中,依据诈骗分子的画像确定多个第一筛查特征, 包括:依据诈骗分子的画像,确定诈骗人员对应的行为数据;分析行为数 据,并确定行为数据对应的多个特征;将多个特征确定为多个第一筛查特 征,其中,每个第一筛查特征关联一个阈值范围。
79.在一种可选的实例中,获取b域数据,并通过多个第一筛查特征对b 域数据进行初步筛选以得到第一目标数据,包括:获取b域数据中包含的 电话号码对应的行为数据,以及行为数据对应的多个特征;确定行为数据 的多个特征对应的数值,是否均不处于与多个特征对应的多个第一筛查特 征相关联的多个阈值范围内;将特征对应的数值均不处于对应的多个阈值 范围内的电话号码数据剔除,并将剩余数据确定为第一目标数据。
80.在一种可选的实例中,在将第一目标数据输入至反诈模型,并控制反 诈模型输出诈骗话单以及诈骗话单对应的诈骗事件之前,该方法包括:获 取正样本数据以及负样本数据,负样本数据包括多个不为诈骗电话对应的 数据;依据诈骗分子的画像,确定第二筛查特征,其中,第二筛查特征的 数量大于第一筛查特征的数量;依据正样本数据以及负样本数据以及第二 筛查特征,构建反诈模型。
81.在一种可选的实例中,控制反诈模型输出诈骗话单以及诈骗话单对应 的诈骗事件,包括:控制反诈模型对诈骗话单进行分析,以确定诈骗话单 中包含的号码;确定号码对应的通话信息,依据通话信息确定诈骗事件。
82.在一种可选的实例中,在将第一目标数据输入至反诈模型,并控制反 诈模型输出诈骗话单以及诈骗话单对应的诈骗事件之后,该方法包括:依 据诈骗事件,确定诈骗事件对应的受害人;基于诈骗事件生成提醒,并将 提醒发送至受害人对应的通信终端上。
83.本文中的设备可以是服务器、pc、pad、手机等。
84.本发明还提供了一种计算机程序产品,当在数据处理设备上执行时, 适于执行初
始化有如下方法步骤的程序:确定诈骗分子的画像,并依据诈 骗分子的画像确定多个第一筛查特征;获取b域数据,并通过多个第一筛 查特征对b域数据进行初步筛选以得到第一目标数据,其中,b域数据包 含多个待确定是否为诈骗号码的号码对应的数据;将第一目标数据输入至 反诈模型,并控制反诈模型输出诈骗话单以及诈骗话单对应的诈骗事件。
85.在一种可选的实例中,确定诈骗分子的画像,包括:获取正样本数据, 正样本数据包括多个诈骗电话对应的数据;依据大数据分析对正样本数据 进行分析以确定多个诈骗分子的多个画像,其中,诈骗分子的画像至少包 括:诈骗分子使用的电话号码信息、诈骗分子的身份信息、诈骗分子的终 端信息、终端对应的基站信息、电话号码对应的套餐实用信息、电话号码 对应的消费信息。
86.在一种可选的实例中,依据诈骗分子的画像确定多个第一筛查特征, 包括:依据诈骗分子的画像,确定诈骗人员对应的行为数据;分析行为数 据,并确定行为数据对应的多个特征;将多个特征确定为多个第一筛查特 征,其中,每个第一筛查特征关联一个阈值范围。
87.在一种可选的实例中,获取b域数据,并通过多个第一筛查特征对b 域数据进行初步筛选以得到第一目标数据,包括:获取b域数据中包含的 电话号码对应的行为数据,以及行为数据对应的多个特征;确定行为数据 的多个特征对应的数值,是否均不处于与多个特征对应的多个第一筛查特 征相关联的多个阈值范围内;将特征对应的数值均不处于对应的多个阈值 范围内的电话号码数据剔除,并将剩余数据确定为第一目标数据。
88.在一种可选的实例中,在将第一目标数据输入至反诈模型,并控制反 诈模型输出诈骗话单以及诈骗话单对应的诈骗事件之前,该方法包括:获 取正样本数据以及负样本数据,负样本数据包括多个不为诈骗电话对应的 数据;依据诈骗分子的画像,确定第二筛查特征,其中,第二筛查特征的 数量大于第一筛查特征的数量;依据正样本数据以及负样本数据以及第二 筛查特征,构建反诈模型。
89.在一种可选的实例中,控制反诈模型输出诈骗话单以及诈骗话单对应 的诈骗事件,包括:控制反诈模型对诈骗话单进行分析,以确定诈骗话单 中包含的号码;确定号码对应的通话信息,依据通话信息确定诈骗事件。
90.在一种可选的实例中,在将第一目标数据输入至反诈模型,并控制反 诈模型输出诈骗话单以及诈骗话单对应的诈骗事件之后,该方法包括:依 据诈骗事件,确定诈骗事件对应的受害人;基于诈骗事件生成提醒,并将 提醒发送至受害人对应的通信终端上。
91.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、 或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施 例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个 或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不 限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形 式。
92.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程 序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现 流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图 中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、 专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一 个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令 产生
用于实现在流程图一个流程或多个流程和/或方框图一个方框或多 个方框中指定的功能的装置。
93.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处 理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读 存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一 个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
94.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备 上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机 实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现 在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定 的功能的步骤。
95.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入 /输出接口、网络接口和内存。
96.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储 器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。存储器是计算机可读介质的示例。
97.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以 由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结 构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相 变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器 (dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦 除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘 只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式 磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用 于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质 不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载 波。
98.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵 盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设 备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包 括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情 况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、 方法、商品或者设备中还存在另外的相同要素。
99.本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算 机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结 合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其 中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘 存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
100.以上仅为本发明的实施例而已,并不用于限制本发明。对于本领域技 术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之 内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范 围之内。
技术特征:1.一种诈骗号码的确定方法,其特征在于,包括:确定诈骗分子的画像,并依据所述诈骗分子的所述画像确定多个第一筛查特征;获取b域数据,并通过多个所述第一筛查特征对所述b域数据进行初步筛选以得到第一目标数据,其中,所述b域数据包含多个待确定是否为诈骗号码的号码对应的数据;将所述第一目标数据输入至反诈模型,并控制所述反诈模型输出诈骗话单以及所述诈骗话单对应的诈骗事件。2.根据权利要求1所述的方法,其特征在于,确定诈骗分子的画像,包括:获取正样本数据,所述正样本数据包括多个诈骗电话对应的数据;依据大数据分析对所述正样本数据进行分析以确定多个所述诈骗分子的多个画像,其中,所述诈骗分子的画像至少包括:所述诈骗分子使用的电话号码信息、所述诈骗分子的身份信息、所述诈骗分子的终端信息、所述终端对应的基站信息、所述电话号码对应的套餐实用信息、所述电话号码对应的消费信息。3.根据权利要求2所述的方法,其特征在于,依据所述诈骗分子的所述画像确定多个第一筛查特征,包括:依据所述诈骗分子的画像,确定所述诈骗人员对应的行为数据;分析所述行为数据,并确定所述行为数据对应的多个特征;将多个所述特征确定为多个第一筛查特征,其中,每个所述第一筛查特征关联一个阈值范围。4.根据权利要求3所述的方法,其特征在于,获取b域数据,并通过多个所述第一筛查特征对所述b域数据进行初步筛选以得到第一目标数据,包括:获取所述b域数据中包含的所述电话号码对应的行为数据,以及所述行为数据对应的多个特征;确定所述行为数据的多个所述特征对应的数值,是否均不处于与多个所述特征对应的多个所述第一筛查特征相关联的多个所述阈值范围内;将所述特征对应的数值均不处于对应的多个所述阈值范围内的电话号码数据剔除,并将剩余数据确定为所述第一目标数据。5.根据权利要求2所述的方法,其特征在于,在将所述第一目标数据输入至反诈模型,并控制所述反诈模型输出诈骗话单以及所述诈骗话单对应的诈骗事件之前,所述方法包括:获取所述正样本数据以及负样本数据,所述负样本数据包括多个不为诈骗电话对应的数据;依据所述诈骗分子的画像,确定第二筛查特征,其中,所述第二筛查特征的数量大于所述第一筛查特征的数量;依据所述正样本数据以及所述负样本数据以及所述第二筛查特征,构建所述反诈模型。6.根据权利要求2所述的方法,其特征在于,控制所述反诈模型输出诈骗话单以及所述诈骗话单对应的诈骗事件,包括:控制所述反诈模型对所述诈骗话单进行分析,以确定所述诈骗话单中包含的号码;确定所述号码对应的通话信息,依据所述通话信息确定所述诈骗事件。
7.根据权利要求2所述的方法,其特征在于,在将所述第一目标数据输入至反诈模型,并控制所述反诈模型输出诈骗话单以及所述诈骗话单对应的诈骗事件之后,所述方法包括:依据所述诈骗事件,确定所述诈骗事件对应的受害人;基于所述诈骗事件生成提醒,并将所述提醒发送至所述受害人对应的通信终端上。8.一种诈骗号码的确定装置,其特征在于,包括:第一确定单元,确定诈骗分子的画像,并依据所述诈骗分子的所述画像确定多个第一筛查特征;第一获取单元,获取b域数据,并通过多个所述第一筛查特征对所述b域数据进行初步筛选以得到第一目标数据,其中,所述b域数据包含多个待确定是否为诈骗号码的号码对应的数据;控制单元,将所述第一目标数据输入至反诈模型,并控制所述反诈模型输出诈骗话单以及所述诈骗话单对应的诈骗事件。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述一种诈骗号码的确定方法。10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述一种诈骗号码的确定方法。
技术总结本发明公开了一种诈骗号码的确定方法及装置。该发明包括:确定诈骗分子的画像,并依据诈骗分子的画像确定多个第一筛查特征;获取B域数据,并通过多个第一筛查特征对B域数据进行初步筛选以得到第一目标数据,其中,B域数据包含多个待确定是否为诈骗号码的号码对应的数据;将第一目标数据输入至反诈模型,并控制反诈模型输出诈骗话单以及诈骗话单对应的诈骗事件。通过本发明,解决了相关技术中对诈骗号码进行检测输出,提升用户诈骗场景识别精准度同时保证数据的覆盖度的问题。度同时保证数据的覆盖度的问题。度同时保证数据的覆盖度的问题。
技术研发人员:柳清译 胡炳慈 邹璐 王艳 吴剑
受保护的技术使用者:中国电信股份有限公司
技术研发日:2021.12.27
技术公布日:2022/7/4