聚焦互联网流量的行为大数据分析方法及系统与流程

allin2022-07-27  142



1.本公开涉及大数据技术领域,尤其涉及一种聚焦互联网流量的行为大数据分析方法及系统。


背景技术:

2.在当今的流量时代,流量分析的目的不仅仅针对性能、安全性、常规网络操作和管理,更多的流量分析侧重于用户分析和大数据挖掘,也即,现行的流量分析更加关注互联网的用户热度、关注度和兴趣程度。高流量的互联网活动会话能够带来较为丰富的数据价值和隐型资产,因此,针对互联网流量的分析技术越来越多。然而经发明人研究分析后发现,大部分技术难以实现高质量的互联网流量分析。


技术实现要素:

3.本公开的技术方案是通过如下至少部分实施例实现的。
4.一种聚焦互联网流量的行为大数据分析方法,其中,所述方法由行为大数据分析系统实施,所述方法至少包括:收集待分析在线会话的会话关注流量评分、所述待分析在线会话的x组第一互联网用户行为大数据、与所述x组第一互联网用户行为大数据指向的x组第二互联网用户行为大数据;其中,所述x组第一互联网用户行为大数据包含如下一种或多种:视觉行为大数据、语音行为大数据,所述x组第二互联网用户行为大数据通过预设数据处理线程捕捉所得,x为正整数;从所述x组第一互联网用户行为大数据中确定x个显著活动行为事件;其中,所述x个显著活动行为事件包含流量评分反映所述待分析在线会话的流量评分的活动行为事件;结合所述x组第一互联网用户行为大数据和所述x组第二互联网用户行为大数据之间的x个对应指示以及x个目标分布标识,获得所述x个显著活动行为事件的x个第一流量评分;其中,所述x个目标分布标识为所述x个显著活动行为事件在所述x组第一互联网用户行为大数据中的分布标识;结合所述x个第一流量评分和所述会话关注流量评分之间的比较结果,确定所述预设数据处理线程的流量分析性能。
5.在一些独立的实施例中,其中,所述从所述x组第一互联网用户行为大数据中确定x个显著活动行为事件,包括:对所述x组第一互联网用户行为大数据进行行为注意力影响指数识别操作,确定所述x组第一互联网用户行为大数据中的x个候选活动行为事件的x个第一行为注意力影响指数;结合所述x个第一行为注意力影响指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
6.在一些独立的实施例中,其中,在所述结合所述x个第一行为注意力影响指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件之前,所述方法还包括:对所述x组第一互联网用户行为大数据进行流量评分持续性识别,确定所述x个候选活动行为事件的x个流量传递描述,所述流量传递描述反映所述候选活动行为事件的流量评分与所述待分析在线会话的流量评分的相关性系数;所述结合所述x个第一行为注意力影响指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件,包括:结合所述x个第一行为
注意力影响指数和所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
7.在一些独立的实施例中,其中,所述对所述x组第一互联网用户行为大数据进行流量评分持续性识别,确定所述x个候选活动行为事件的x个流量传递描述,包括:对所述x组第一互联网用户行为大数据进行特征维度识别操作,获得所述x组第一互联网用户行为大数据中x个候选交互会话的x个特征维度,所述x个候选交互会话包括所述x个候选活动行为事件;结合所述x个特征维度,获得所述x个流量传递描述,所述候选交互会话的特征维度越少,所述候选交互会话的流量评分与所述待分析在线会话的流量评分的相关性系数越大。
8.在一些独立的实施例中,其中,所述对所述x组第一互联网用户行为大数据进行流量评分持续性识别,确定所述x个候选活动行为事件的x个流量传递描述,包括:对所述x组第一互联网用户行为大数据进行受影响偏好值识别操作,获得所述x组第一互联网用户行为大数据中x个候选交互会话的x个受影响偏好值,所述x个候选交互会话包括所述x个候选活动行为事件;结合所述x个受影响偏好值,获得所述x个流量传递描述,所述候选交互会话的受影响偏好值越少,所述候选交互会话的流量评分与所述待分析在线会话的流量评分的相关性系数越大。
9.在一些独立的实施例中,其中,所述第一互联网用户行为大数据的数目大于1,所述结合所述x个第一行为注意力影响指数和所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件之前,所述方法还包括:对所述x组第一互联网用户行为大数据进行引导状态识别,确定所述x个候选活动行为事件的x个引导状态指数,所述引导状态指数反映所述候选活动行为事件对应的流量引导系数;所述结合所述x个第一行为注意力影响指数和所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件,包括:结合所述x个第一行为注意力影响指数、所述x个流量传递描述和所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
10.在一些独立的实施例中,其中,所述对所述x组第一互联网用户行为大数据进行行为注意力影响指数识别操作,确定所述x组第一互联网用户行为大数据中的x个候选活动行为事件的x个第一行为注意力影响指数,包括:对所述x组第一互联网用户行为大数据进行交互会话识别操作,获得所述x组第一互联网用户行为大数据中的x个候选交互会话的x个交互会话语义关键词,所述候选交互会话包括所述x个候选活动行为事件;结合所述x个交互会话语义关键词,获得所述x个候选交互会话的x个第二行为注意力影响指数;结合所述x个第二行为注意力影响指数,获得所述x个候选活动行为事件的所述x个第一行为注意力影响指数。
11.在一些独立的实施例中,其中,在所述第一互联网用户行为大数据的数目大于1的条件下,所述结合所述x个第一行为注意力影响指数、所述x个流量传递描述和所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件之前,所述方法还包括:确定所述x个交互会话语义关键词的x个第一命中因子;结合所述x个第一命中因子,获得所述x个候选活动行为事件的x个第二命中因子;所述结合所述x个第一行为注意力影响指数、所述x个流量传递描述和所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件,包括:结合所述x个第一行为注意力影响指数、所述x个流量传递描述、所述x个引导状态指数和所述x个第二命中因子,从所述x个候选活动行为事件
中确定所述x个显著活动行为事件。
12.在一些独立的实施例中,其中,所述从所述x组第一互联网用户行为大数据中确定x个显著活动行为事件,包括:对所述x组第一互联网用户行为大数据进行流量评分持续性识别,确定所述x个候选活动行为事件的x个流量传递描述,所述流量传递描述反映所述候选活动行为事件的流量评分与所述待分析在线会话的流量评分的相关性系数;结合所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
13.在一些独立的实施例中,其中,在所述结合所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件之前,所述方法还包括:对所述x组第一互联网用户行为大数据进行引导状态识别,确定所述x个候选活动行为事件的x个引导状态指数,所述引导状态指数反映所述候选活动行为事件对应的流量引导系数;所述结合所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件,包括:结合所述x个引导状态指数和所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
14.在一些独立的实施例中,其中,所述从所述x组第一互联网用户行为大数据中确定x个显著活动行为事件,包括:对所述x组第一互联网用户行为大数据进行引导状态识别,确定所述x个候选活动行为事件的x个引导状态指数,所述引导状态指数反映所述候选活动行为事件对应的流量引导系数;结合所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
15.在一些独立的实施例中,其中,在结合所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件之前,所述方法还包括:对所述x组第一互联网用户行为大数据进行行为注意力影响指数识别操作,确定所述x组第一互联网用户行为大数据中的x个候选活动行为事件的x个第一行为注意力影响指数;所述结合所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件,包括:结合所述x个第一行为注意力影响指数和所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
16.在一些独立的实施例中,其中,所述待分析在线会话包括满足流量分析要求的交互会话,所述满足流量分析要求的交互会话符合如下一项或多项要求:特征维度不大于第一判定值、行为注意力影响指数不小于第二判定值、受影响偏好值不大于第三判定值;所述从所述x组第一互联网用户行为大数据中确定x个显著活动行为事件,包括:对所述x组第一互联网用户行为大数据进行目标识别操作,获得所述满足流量分析要求的交互会话在所述x组第一互联网用户行为大数据中的所关联的x个行为大数据集;从所述x个行为大数据集中确定x个活动行为事件作为所述x个显著活动行为事件。
17.在一些独立的实施例中,其中,第一流量评分的数目大于1的条件下,所述结合所述x个第一流量评分和所述会话关注流量评分之间的比较结果,确定所述预设数据处理线程的流量分析性能,包括:分别确定x个第一流量评分与所述会话关注流量评分的量化分析结果,获得y个第二流量评分,y为大于1的整数;对所述y个第二流量评分进行清洗操作,获得x个第三流量评分;确定所述x个第三流量评分的全局量化结果,获得所述流量分析性能。
18.一种行为大数据分析系统,包括:用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现上述方法的处理器。
19.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行上述方法。
20.根据本公开的相关实施例,行为大数据分析系统在从x组第一互联网用户行为大数据中确定x个显著活动行为事件的条件下,结合x组第二互联网用户行为大数据,确定x个显著活动行为事件的x个第一流量评分。结合x个第一流量评分与会话关注流量评分之间的比较结果,获得预设数据处理线程的流量分析性能,不仅能够在一定程度上确保对流量分析性能进行确定的精度和可信度,还能够提高流量分析性能的确定时效性,减少不必要的资源开销,这样一来,可以通过流量分析性能对预设数据处理线程进行调整优化,从而保障后续在应用该预设数据处理线程时可以尽量提高流量分析精度和可信度,确保不同来源的行为大数据之间的流量分析偏移最小化,以便实现高质量的互联网流量分析。
附图说明
21.图1是示出可以实现本公开的实施例的行为大数据分析系统的一种通信配置的示意图。图2是示出可以实现本公开的实施例的聚焦互联网流量的行为大数据分析方法的流程示意图。图3是示出可以实现本公开的实施例的聚焦互联网流量的行为大数据分析方法的应用环境的架构示意图。
具体实施方式
22.图1是示出可以实现本公开的实施例的行为大数据分析系统100的一种通信配置的框图,行为大数据分析系统100包括用于存储可执行计算机程序的存储器101,用于执行所述存储器101中存储的可执行计算机程序时实现本公开实施例中聚焦互联网流量的行为大数据分析方法的处理器102。
23.图2是示出可以实现本公开的实施例的聚焦互联网流量的行为大数据分析方法的流程示意图,聚焦互联网流量的行为大数据分析方法可以通过图1所示的行为大数据分析系统100实现,进一步可以包括以下相关步骤所描述的技术方案。
24.步骤s201:收集待分析在线会话的会话关注流量评分、所述待分析在线会话的x组第一互联网用户行为大数据,以及与所述x组第一互联网用户行为大数据指向的x组第二互联网用户行为大数据。
25.对于本公开的一些示例而言,所述x组第一互联网用户行为大数据包含如下一种或多种:视觉行为大数据、语音行为大数据,所述x组第二互联网用户行为大数据通过预设数据处理线程捕捉所得。预设数据处理线程可以独立于行为大数据分析系统,换言之,第一互联网用户行为大数据和第二互联网用户行为大数据的数据来源可以不同。
26.对于本公开的一些示例而言,待分析在线会话可以是不同类型的在线会话。比如,待分析在线会话为电子商务会话。又比如,待分析在线会话为数字办公会话。再比如,待分析在线会话为社交娱乐会话。待分析在线会话的会话关注流量评分可以是待分析在线会话的受欢迎程度或者用户关注程度。可以理解,会话关注流量评分越高,表明待分析在线会话的受欢迎程度或者用户关注程度越高。
27.对于本公开的一些示例而言,第一互联网用户行为大数据可以是视觉行为大数据,第一互联网用户行为大数据也可以是语音行为大数据。在第一互联网用户行为大数据
的数目大于1的条件下,x组第一互联网用户行为大数据可以包括视觉行为大数据和语音行为大数据中的一种或两种。
28.比如,x组第一互联网用户行为大数据包括互联网用户行为大数据behavior_data_a和互联网用户行为大数据behavior_data_b,其中,互联网用户行为大数据behavior_data_a和互联网用户行为大数据behavior_data_b都是视觉行为大数据。又比如,x组第一互联网用户行为大数据包括互联网用户行为大数据behavior_data_a和互联网用户行为大数据behavior_data_b,其中,互联网用户行为大数据behavior_data_a和互联网用户行为大数据behavior_data_b都是语音行为大数据。再比如,x组第一互联网用户行为大数据包括互联网用户行为大数据behavior_data_a和互联网用户行为大数据behavior_data_b,其中,互联网用户行为大数据behavior_data_a是视觉行为大数据,互联网用户行为大数据behavior_data_b是语音行为大数据。
29.对于本公开的一些示例而言,预设数据处理线程捕捉到的互联网用户行为大数据具有流量评分数据,换言之,x组第二互联网用户行为大数据都具有待分析在线会话的流量评分数据。x组第二互联网用户行为大数据与x组第一互联网用户行为大数据具有配对关系,换言之,x组第二互联网用户行为大数据具有x组第一互联网用户行为大数据中的活动行为事件的流量评分。
30.比如,x组第一互联网用户行为大数据包括互联网用户行为大数据behavior_data_a,x组第二互联网用户行为大数据包括互联网用户行为大数据behavior_data_b,互联网用户行为大数据behavior_data_a包括活动行为事件activity_case_c和活动行为事件activity_case_d,其中,活动行为事件activity_case_c与交互会话阶段session_node_a具有配对关系,活动行为事件activity_case_d与交互会话阶段session_node_b具有配对关系。在这种情况下,互联网用户行为大数据behavior_data_b具有活动行为事件activity_case_c的流量评分network_flow_value_c以及活动行为事件activity_case_d的流量评分network_flow_value_d,其中,流量评分network_flow_value_c反映交互会话阶段session_node_a的流量评分,流量评分network_flow_value_d反映交互会话阶段session_node_b的流量评分。
31.又比如,x组第一互联网用户行为大数据包括互联网用户行为大数据behavior_data_a和互联网用户行为大数据behavior_data_b,x组第二互联网用户行为大数据包括互联网用户行为大数据behavior_data_c和互联网用户行为大数据behavior_data_d,其中,互联网用户行为大数据behavior_data_c与互联网用户行为大数据behavior_data_a具有配对关系,互联网用户行为大数据behavior_data_d与互联网用户行为大数据behavior_data_b具有配对关系。互联网用户行为大数据behavior_data_a包括活动行为事件activity_case_a,互联网用户行为大数据behavior_data_b包括活动行为事件activity_case_b,其中,活动行为事件activity_case_a与交互会话阶段session_node_c具有配对关系,活动行为事件activity_case_b与交互会话阶段session_node_d具有配对关系。在这种情况下,互联网用户行为大数据behavior_data_c具有活动行为事件activity_case_a的流量评分network_flow_value_e,互联网用户行为大数据behavior_data_d具有活动行为事件activity_case_b的流量评分network_flow_value_f,其中,流量评分network_flow_value_e反映交互会话阶段session_node_c的流量评分,流量评分network_flow_value_f
反映交互会话阶段session_node_d的流量评分。
32.在一些示例中,第一互联网用户行为大数据的数据规模和与第一互联网用户行为大数据指向的第二互联网用户行为大数据的数据规模一致。比如,x组第一互联网用户行为大数据包括第一互联网用户行为大数据behavior_data_a和第一互联网用户行为大数据behavior_data_b,x组第二互联网用户行为大数据包括第二互联网用户行为大数据behavior_data_c和第二互联网用户行为大数据behavior_data_d,其中,互联网用户行为大数据behavior_data_a与互联网用户行为大数据behavior_data_c具有配对关系,互联网用户行为大数据behavior_data_b与互联网用户行为大数据behavior_data_d具有配对关系。在这种情况下,互联网用户行为大数据behavior_data_a的数据规模与互联网用户行为大数据behavior_data_c的数据规模相同,互联网用户行为大数据behavior_data_b的数据规模与互联网用户行为大数据behavior_data_d的数据规模一致。
33.对于本公开的一些示例而言,收集待分析在线会话的会话关注流量评分、确定第一互联网用户行为大数据以及确定第二互联网用户行为大数据的实施先后性和异同步性不限。此外,会话关注流量评分的收集方式也不限,可以间接调用,也可以直接通过预置的流量分析算法得到。
34.步骤s202:从所述x组第一互联网用户行为大数据中确定x个显著活动行为事件。
35.对于本公开的一些示例而言,待分析在线会话中有可能具有流量评分与会话关注流量评分一致的交互会话,也有可能具有流量评分与会话关注流量评分不一致的交互会话,对于本公开的一些示例而言,将流量评分与会话关注流量评分一致的交互会话所关联的活动行为事件称为显著活动行为事件,比如显著活动行为事件的流量评分反映待分析在线会话的流量评分。
36.对于一些可选的示例而言,行为大数据分析系统通过对x组第一互联网用户行为大数据进行交互会话识别操作,获得x组第一互联网用户行为大数据中的x个候选交互会话的x个交互会话语义关键词。结合交互会话语义关键词和目标迁移参考确定流量评分反映会话关注流量评分的x个目标交互会话,其中,目标迁移参考反映交互会话的交互会话语义关键词与交互会话的流量评分是否可反映会话关注流量评分的迁移变换(因而目标迁移参考也可以理解为映射列表或者映射参考)。将x个目标交互会话所关联的x个活动行为事件作为x个显著活动行为事件。比如,x组第一互联网用户行为大数据包括互联网用户行为大数据behavior_data_a。行为大数据分析系统通过对互联网用户行为大数据behavior_data_a进行交互会话识别操作,确定互联网用户行为大数据behavior_data_a中的交互会话session_a为平台直播带货会话、互联网用户行为大数据behavior_data_a中的交互会话session_b为用户观看会话。目标迁移参考包括平台直播带货会话的流量评分可反映会话关注流量评分,以及用户观看会话的流量评分不可反映会话关注流量评分。行为大数据分析系统结合交互会话session_a的交互会话语义关键词、交互会话session_b的交互会话语义关键词和目标迁移参考,确定交互会话session_a的流量评分可反映会话关注流量评分、交互会话session_b的流量评分不可反映会话关注流量评分。行为大数据分析系统进而将交互会话session_a所关联的x个活动行为事件作为x个显著活动行为事件。
37.在其他的一些示例下,行为大数据分析系统使用显著活动行为事件识别策略对x组第一互联网用户行为大数据进行处理,获得x个显著活动行为事件,其中,显著活动行为
事件识别策略通过将多组先验的互联网用户行为大数据作为调试示例,对相关神经网络进行调试获得。调试示例中的互联网用户行为大数据的先验知识包括:互联网用户行为大数据中的活动行为事件是否为显著活动行为事件。对于一些可选的示例而言,显著活动行为事件可以理解为特征识别度较高的事件或者具有一定分析价值的事件,比如业务推荐过程中的高质量评价事件或者恶意竞争事件等。
38.步骤s203:结合所述x组第一互联网用户行为大数据和所述x组第二互联网用户行为大数据之间的x个对应指示以及x个目标分布标识,获得所述x个显著活动行为事件的x个第一流量评分。
39.对于本公开的一些示例而言,显著活动行为事件在第一互联网用户行为大数据中的分布标识为目标分布标识,x个目标分布标识包括x个显著活动行为事件在x组第一互联网用户行为大数据中的分布标识(相对区域分布或者相对位置情况)。比如,x组第一互联网用户行为大数据包括互联网用户行为大数据behavior_data_a和互联网用户行为大数据behavior_data_b,x个显著活动行为事件包括活动行为事件activity_case_c和活动行为事件activity_case_d,其中,活动行为事件activity_case_c对应于互联网用户行为大数据behavior_data_a,活动行为事件activity_case_d对应于互联网用户行为大数据behavior_data_b。在这种情况下,x个目标分布标识包括活动行为事件activity_case_c在互联网用户行为大数据behavior_data_a中的分布标识,以及活动行为事件activity_case_d在互联网用户行为大数据behavior_data_b中的分布标识。
40.对于本公开的一些示例而言,第一互联网用户行为大数据和第二互联网用户行为大数据之间对应指示(也可以理解为变换列表)反映第一互联网用户行为大数据的活动行为事件特征空间与第二互联网用户行为大数据的活动行为事件特征空间之间的变换参考。比如,x组第一互联网用户行为大数据中的互联网用户行为大数据behavior_data_a与x组第二互联网用户行为大数据中的互联网用户行为大数据behavior_data_b具有配对关系,互联网用户行为大数据behavior_data_a与互联网用户行为大数据behavior_data_b之间的对应指示包括互联网用户行为大数据behavior_data_a的活动行为事件特征空间与互联网用户行为大数据behavior_data_b的活动行为事件特征空间之间的变换参考。而上述的特征空间可以基于ai技术创建,在此不作赘述。
41.可以理解的是,x个对应指示包括x组第一互联网用户行为大数据与x组第二互联网用户行为大数据之间的对应指示。比如,x组第一互联网用户行为大数据包括互联网用户行为大数据behavior_data_a和互联网用户行为大数据behavior_data_b,x组第二互联网用户行为大数据包括互联网用户行为大数据behavior_data_c和互联网用户行为大数据behavior_data_d,其中,互联网用户行为大数据behavior_data_a与互联网用户行为大数据behavior_data_c具有配对关系,互联网用户行为大数据behavior_data_b与互联网用户行为大数据behavior_data_d具有配对关系。互联网用户行为大数据behavior_data_a与互联网用户行为大数据behavior_data_c之间的对应指示为对应指示mapping_indication_a,互联网用户行为大数据behavior_data_b与互联网用户行为大数据behavior_data_d之间的对应指示为对应指示mapping_indication_b。在这种情况下,x个对应指示包括对应指示mapping_indication_a和对应指示mapping_indication_b。
42.进一步地,行为大数据分析系统结合目标分布标识和对应指示,可确定第二互联
网用户行为大数据中与显著活动行为事件指向的目标流量评分活动行为事件,进而可结合目标流量评分活动行为事件确定显著活动行为事件的第一流量评分。比如,x组第一互联网用户行为大数据中的互联网用户行为大数据behavior_data_a与x组第二中的互联网用户行为大数据behavior_data_b具有配对关系,其中,互联网用户行为大数据behavior_data_a包括显著活动行为事件activity_case_a。行为大数据分析系统结合显著活动行为事件activity_case_a在互联网用户行为大数据behavior_data_a中的目标分布标识,以及互联网用户行为大数据behavior_data_a与互联网用户行为大数据behavior_data_b之间的对应指示,确定互联网用户行为大数据behavior_data_b中与显著活动行为事件activity_case_a指向的活动行为事件为活动行为事件activity_case_b。行为大数据分析系统进而将活动行为事件activity_case_b的流量评分作为显著活动行为事件activity_case_a的第一流量评分。此外,行为大数据分析系统结合x个目标分布标识、x组第二互联网用户行为大数据以及x个对应指示,可确定x个显著活动行为事件的流量评分,获得x个第一流量评分。
43.步骤s204:结合所述x个第一流量评分和所述会话关注流量评分之间的比较结果,确定所述预设数据处理线程的流量分析性能。
44.对于本公开的一些示例而言,流量分析性能反映预设数据处理线程解析出的流量评分的偏移情况。比如,流量分析性能预设数据处理线程解析出的流量评分比会话关注流量评分高0.1,若预设数据处理线程解析出的交互会话session_a的流量评分为20,则交互会话session_a的最终流量评分为20+0.1。其中,会话关注流量评分可以根据预设规则进行数值区间调整,比如在一些情况下可以设置0~1的评分约束区间,在另一些情况下可以设置0~100的评分约束区间,在此不作限制。
45.可以理解的是,显著活动行为事件的流量评分反映会话关注流量评分,而第一流量评分是通过预设数据处理线程解析出的显著活动行为事件的流量评分,因此行为大数据分析系统结合第一流量评分与会话关注流量评分之间的比较结果,可确定预设数据处理线程的流量分析性能。
46.对于一些可选的示例而言,行为大数据分析系统确定其中一个第一流量评分与会话关注流量评分的量化分析结果,获得预设数据处理线程的流量分析性能。
47.在其他的一些示例下,行为大数据分析系统确定x个第一流量评分的全局量化结果(比如可以理解为平均值),并将全局量化结果与会话关注流量评分的量化分析结果,作为预设数据处理线程的流量分析性能。在另外的一些示例下,行为大数据分析系统确定x个第一流量评分的全局量化结果与会话关注流量评分的量化分析结果,获得指定量化差异。将指定量化差异与默认值的加权结果作为预设数据处理线程的流量分析性能。比如,x个第一流量评分包括第一流量评分network_flow_value_a和第一流量评分network_flow_value_b,其中,第一流量评分network_flow_value_a为30.2,第一流量评分network_flow_value_b为30.9。x个第一流量评分的全局量化结果为30.55。若会话关注流量评分为30,默认值为0.1。那么流量分析性能为30.55-30+0.1=0.65。
48.对于本公开的一些示例而言,行为大数据分析系统在从x组第一互联网用户行为大数据中确定x个显著活动行为事件的条件下,结合x组第二互联网用户行为大数据,确定x个显著活动行为事件的x个第一流量评分。结合x个第一流量评分与会话关注流量评分之间
的比较结果,获得预设数据处理线程的流量分析性能,不仅能够在一定程度上确保对流量分析性能进行确定的精度和可信度,还能够提高流量分析性能的确定时效性,减少不必要的资源开销,这样一来,可以通过流量分析性能对预设数据处理线程进行调整优化,从而保障后续在应用该预设数据处理线程时可以尽量提高流量分析精度和可信度,确保不同来源的行为大数据之间的流量分析偏移最小化。
49.在一些独立的设计思路下,行为大数据分析系统在实施步骤s202时可以通过如下技术方案实现。
50.步骤s1:对所述x组第一互联网用户行为大数据进行行为注意力影响指数识别操作,确定所述x组第一互联网用户行为大数据中的x个候选活动行为事件的x个第一行为注意力影响指数。
51.对于本公开的一些示例而言,交互会话的行为注意力影响指数(包括所述第一行为注意力影响指数和后续的第二行为注意力影响指数)反映交互会话对于其他用户的影响力。交互会话行为注意力影响指数越大,所获得的交互会话的流量评分越精准。
52.对于本公开的一些示例而言,行为注意力影响指数识别操作用作识别互联网用户行为大数据中的活动行为事件的行为注意力影响指数,其中,活动行为事件的行为注意力影响指数反映活动行为事件所指向的交互会话阶段的行为注意力影响指数。比如,互联网用户行为大数据behavior_data_a包括活动行为事件activity_case_b,其中,活动行为事件activity_case_b所指向的交互会话阶段为交互会话阶段session_node_c。通过对互联网用户行为大数据behavior_data_a进行行为注意力影响指数识别操作,确定活动行为事件activity_case_b的行为注意力影响指数为0.35,比如交互会话阶段session_node_c的行为注意力影响指数为0.35。
53.对于本公开的一些示例而言,候选活动行为事件为第一互联网用户行为大数据中的活动行为事件。行为大数据分析系统通过对一组第一互联网用户行为大数据进行行为注意力影响指数识别操作,可确定x个候选活动行为事件的x个行为注意力影响指数。比如,第一互联网用户行为大数据包括活动行为事件activity_case_a和活动行为事件activity_case_b,在这种情况下,x个候选活动行为事件包括活动行为事件activity_case_a和活动行为事件activity_case_b。行为大数据分析系统通过对第一互联网用户行为大数据进行行为注意力影响指数识别操作,可确定活动行为事件activity_case_a的行为注意力影响指数和活动行为事件activity_case_b的行为注意力影响指数。在这种情况下,x个第一行为注意力影响指数包括活动行为事件activity_case_a的行为注意力影响指数和活动行为事件activity_case_b的行为注意力影响指数。
54.对于一些可选的示例而言,行为大数据分析系统通过行为注意力影响指数识别策略实现行为注意力影响指数识别操作,其中,行为注意力影响指数识别策略通过将多组先验的互联网用户行为大数据作为调试示例,对相关神经网络进行调试获得。调试示例中的互联网用户行为大数据的先验知识包括:互联网用户行为大数据中的活动行为事件的行为注意力影响指数。
55.步骤s2:结合所述x个第一行为注意力影响指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
56.结合步骤s1的内容,交互会话行为注意力影响指数越大,所获得的交互会话的流
量评分越精准,而预设数据处理线程是通过行为注意力影响分析来确定流量评分的,鉴于此,为提升预设数据处理线程确定的流量评分的精度和可信度,可将行为注意力影响指数较大的候选活动行为事件作为显著活动行为事件。
57.对于一些可选的示例而言,行为大数据分析系统将第一行为注意力影响指数不小于行为注意力影响指数判定值的候选活动行为事件作为显著活动行为事件。
58.在其他的一些示例下,行为大数据分析系统结合第一行为注意力影响指数获得候选活动行为事件的行为注意力影响指数的命中因子(可信系数或者可信度),其中,行为注意力影响指数的命中因子与第一行为注意力影响指数满足第一设定关系(比如满足正相关关系)。行为大数据分析系统将行为注意力影响指数的命中因子不小于行为注意力影响指数的命中因子判定值的候选活动行为事件作为显著活动行为事件。
59.对于本公开的一些示例而言,行为大数据分析系统基于实施步骤s1和步骤s2所描述的内容,确定x个候选活动行为事件的x个第一行为注意力影响指数,进而结合x个行为注意力影响指数从x个候选活动行为事件中确定x个显著活动行为事件,从而使x个显著活动行为事件的流量评分可更精准可信地反映会话关注流量评分。
60.在一些独立的设计思路下,行为大数据分析系统在实施步骤s2之前,还可以实施如下技术方案。
61.步骤s3:对所述x组第一互联网用户行为大数据进行流量评分持续性识别,确定所述x个候选活动行为事件的x个流量传递描述。
62.对于本公开的一些示例而言,流量传递描述反映活动行为事件的流量评分与在线会话的流量评分的相关性系数。比如,游客用户会话的流量评分与游客用户会话所对应的在线会话的流量评分的相关性系数高。若待分析在线会话包括游客用户会话,那么第一互联网用户行为大数据中游客用户会话所关联的活动行为事件的流量评分与待分析在线会话的流量评分的相关性系数高。又比如,若待分析在线会话包括用户观看会话(固定客户会话),那么第一互联网用户行为大数据中用户观看会话所关联的活动行为事件的流量评分与待分析在线会话的流量评分的相关性系数低。
63.进一步地,流量传递描述不大于1且不小于0,且活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。
64.对于本公开的一些示例而言,流量评分持续性识别用于识别互联网用户行为大数据中活动行为事件的流量传递描述,其中,活动行为事件的流量传递描述反映活动行为事件所指向的交互会话阶段的流量传递描述。比如,互联网用户行为大数据behavior_data_a包括活动行为事件activity_case_b,其中,活动行为事件activity_case_b所指向的交互会话阶段为交互会话阶段session_node_c。通过对互联网用户行为大数据behavior_data_a进行流量评分持续性识别,确定活动行为事件activity_case_b的流量传递描述为0.35,比如交互会话阶段session_node_c的流量传递描述为0.35。
65.对于本公开的一些示例而言,行为大数据分析系统通过对一组第一互联网用户行为大数据进行流量评分持续性识别,可确定x个候选活动行为事件的x个流量传递描述。比如,第一互联网用户行为大数据包括活动行为事件activity_case_a和活动行为事件activity_case_b,此时x个候选活动行为事件包括活动行为事件activity_case_a和活动行为事件activity_case_b。行为大数据分析系统通过对第一互联网用户行为大数据进行
流量评分持续性识别,可确定活动行为事件activity_case_a的流量传递描述和活动行为事件activity_case_b的流量传递描述。在这种情况下,x个流量传递描述包括活动行为事件activity_case_a的流量传递描述和活动行为事件activity_case_b的流量传递描述。
66.对于一些可选的示例而言,行为大数据分析系统通过流量评分持续性识别策略实现流量评分持续性识别,其中,流量评分持续性识别策略通过将多组先验的互联网用户行为大数据作为调试示例,对相关神经网络进行调试获得。调试示例中的互联网用户行为大数据的先验知识包括:互联网用户行为大数据中的活动行为事件的流量传递描述。
67.在实施完步骤s3的条件下,行为大数据分析系统在实施步骤s2时可以通过如下技术方案实现。
68.步骤s4:结合所述x个第一行为注意力影响指数和所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
69.对于一些可选的示例而言,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。行为大数据分析系统确定将第一行为注意力影响指数不小于行为注意力影响指数判定值,且流量传递描述不小于流量传递描述判定值的候选活动行为事件作为显著活动行为事件。
70.在其他的一些示例下,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。行为大数据分析系统结合第一行为注意力影响指数获得候选活动行为事件的行为注意力影响指数的命中因子,其中,行为注意力影响指数的命中因子与第一行为注意力影响指数满足第一设定关系。行为大数据分析系统将行为注意力影响指数的命中因子不小于行为注意力影响指数的命中因子判定值,且流量传递描述不小于流量传递描述判定值的候选活动行为事件作为显著活动行为事件。
71.在另外的一些示例下,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。行为大数据分析系统结合第一行为注意力影响指数获得候选活动行为事件的行为注意力影响指数的命中因子,其中,行为注意力影响指数的命中因子与第一行为注意力影响指数满足第一设定关系。行为大数据分析系统结合流量传递描述获得候选活动行为事件的流量传递描述的命中因子,其中,流量传递描述的命中因子与流量传递描述满足第一设定关系。行为大数据分析系统将行为注意力影响指数的命中因子不小于行为注意力影响指数的命中因子判定值,且流量传递描述的命中因子不小于流量传递描述的命中因子判定值的候选活动行为事件作为显著活动行为事件。
72.对于本公开的一些示例而言,行为大数据分析系统基于实施步骤s3和步骤s4,确定x个候选活动行为事件的x个流量传递描述,进而结合x个流量传递描述和x个行为注意力影响指数从x个候选活动行为事件中确定x个显著活动行为事件,从而使x个显著活动行为事件的流量评分可更准确可信的反映会话关注流量评分。
73.在一些独立的设计思路下,行为大数据分析系统在实施步骤s3时可以通过如下技术方案实现。
74.步骤s5:对所述x组第一互联网用户行为大数据进行特征维度识别操作,获得所述x组第一互联网用户行为大数据中x个候选交互会话的x个特征维度,所述x个候选交互会话包括所述x个候选活动行为事件。
75.对于本公开的一些示例而言,特征维度识别操作用于识别互联网用户行为大数据
中的交互会话的特征维度。比如,x组第一互联网用户行为大数据包括互联网用户行为大数据behavior_data_a和互联网用户行为大数据behavior_data_b,互联网用户行为大数据behavior_data_a包括交互会话session_a,互联网用户行为大数据behavior_data_b包括交互会话session_b。行为大数据分析系统通过对互联网用户行为大数据behavior_data_a进行特征维度识别操作,确定交互会话session_a的特征维度为2*2。行为大数据分析系统通过对互联网用户行为大数据behavior_data_b进行特征维度识别操作,确定交互会话session_b的特征维度为10*10。
76.对于本公开的一些示例而言,第一互联网用户行为大数据中的交互会话为候选交互会话,x组第一互联网用户行为大数据包括x个候选交互会话,且x个候选交互会话包括x个候选活动行为事件。
77.对于一些可选的示例而言,行为大数据分析系统通过特征维度识别策略实现特征维度识别操作,其中,特征维度识别策略通过将多组先验的互联网用户行为大数据作为调试示例,对相关神经网络进行调试获得。调试示例中的互联网用户行为大数据的先验知识包括:互联网用户行为大数据中的交互会话的特征维度。
78.步骤s6:结合所述x个特征维度,获得所述x个流量传递描述,所述候选交互会话的特征维度越少,所述候选交互会话的流量评分与所述待分析在线会话的流量评分的相关性系数越大。
79.鉴于交互会话的特征维度越大,交互会话的流量评分与会话关注流量评分的相关性系数越低,行为大数据分析系统结合候选交互会话的特征维度,可确定候选交互会话的流量传递描述。行为大数据分析系统结合x个候选交互会话的x个特征维度,可获得x个候选交互会话的x个流量传递描述。
80.可以理解的是,在确定候选交互会话的流量传递描述后,行为大数据分析系统可将候选交互会话的流量传递描述作为候选交互会话所关联的候选活动行为事件的流量传递描述。比如,x组第一互联网用户行为大数据包括互联网用户行为大数据behavior_data_a和互联网用户行为大数据behavior_data_b,互联网用户行为大数据behavior_data_a包括候选交互会话candidate_session_a,互联网用户行为大数据behavior_data_b包括候选交互会话candidate_session_b,候选交互会话candidate_session_a包括候选活动行为事件candidate_case_c,候选交互会话candidate_session_b包括候选活动行为事件candidate_case_d。在这种情况下,x个候选交互会话包括交互会话session_a和交互会话session_b。举例而言,行为大数据分析系统确定候选交互会话candidate_session_a的流量传递描述为0.2、候选交互会话candidate_session_b的流量传递描述为0.4。在这种情况下,行为大数据分析系统确定候选活动行为事件candidate_case_c的流量传递描述为0.2,并确定候选活动行为事件candidate_case_d的流量传递描述为0.4。
81.对于本公开的一些示例而言,行为大数据分析系统基于实施步骤s5和步骤s6,结合候选交互会话的特征维度确定候选交互会话的流量传递描述,进而结合候选交互会话的流量传递描述确定候选活动行为事件的流量传递描述。
82.在一些独立的设计思路下,行为大数据分析系统在实施步骤s3时可以通过如下技术方案实现。
83.步骤s7:对所述x组第一互联网用户行为大数据进行受影响偏好值识别操作,获得
所述x组第一互联网用户行为大数据中x个候选交互会话的x个受影响偏好值,所述x个候选交互会话包括所述x个候选活动行为事件。
84.对于本公开的一些示例而言,受影响偏好值识别操作用于识别互联网用户行为大数据中的交互会话的受影响偏好值。比如,x组第一互联网用户行为大数据包括互联网用户行为大数据behavior_data_a和互联网用户行为大数据behavior_data_b,互联网用户行为大数据behavior_data_a包括交互会话session_a,互联网用户行为大数据behavior_data_b包括交互会话session_b。行为大数据分析系统通过对互联网用户行为大数据behavior_data_a进行受影响偏好值识别操作,确定交互会话session_a的受影响偏好值为influence_rate_1。行为大数据分析系统通过对互联网用户行为大数据behavior_data_b进行受影响偏好值识别操作,确定交互会话session_b的受影响偏好值为influence_rate_2。
85.对于本公开的一些示例而言,第一互联网用户行为大数据中的交互会话为候选交互会话,x组第一互联网用户行为大数据包括x个候选交互会话,且x个候选交互会话包括x个候选活动行为事件。
86.对于一些可选的示例而言,行为大数据分析系统通过受影响偏好值识别策略实现受影响偏好值识别操作,其中,受影响偏好值识别策略通过将多组先验的互联网用户行为大数据作为调试示例,对相关神经网络进行调试获得。调试示例中的互联网用户行为大数据的先验知识包括:互联网用户行为大数据中的交互会话的受影响偏好值。
87.步骤s8:结合所述x个受影响偏好值,获得所述x个流量传递描述,所述候选交互会话的受影响偏好值越少,所述候选交互会话的流量评分与所述待分析在线会话的流量评分的相关性系数越大。
88.鉴于交互会话的受影响偏好值越大,交互会话的流量评分与会话关注流量评分的相关性系数越低,行为大数据分析系统结合候选交互会话的受影响偏好值,可确定候选交互会话的流量传递描述。行为大数据分析系统结合x个候选交互会话的x个受影响偏好值,可获得x个候选交互会话的x个流量传递描述。
89.可以理解的是,在确定候选交互会话的流量传递描述后,行为大数据分析系统可将候选交互会话的流量传递描述作为候选交互会话所关联的候选活动行为事件的流量传递描述。比如,x组第一互联网用户行为大数据包括互联网用户行为大数据behavior_data_a和互联网用户行为大数据behavior_data_b,互联网用户行为大数据behavior_data_a包括候选交互会话candidate_session_a,互联网用户行为大数据behavior_data_b包括候选交互会话candidate_session_b,候选交互会话candidate_session_a包括候选活动行为事件candidate_case_c,候选交互会话candidate_session_b包括候选活动行为事件candidate_case_d。在这种情况下,x个候选交互会话包括交互会话session_a和交互会话session_b。行为大数据分析系统确定候选交互会话candidate_session_a的流量传递描述为0.25、候选交互会话candidate_session_b的流量传递描述为0.3。在这种情况下,行为大数据分析系统确定候选活动行为事件candidate_case_c的流量传递描述为0.25,并确定候选活动行为事件candidate_case_d的流量传递描述为0.3。
90.对于本公开的一些示例而言,行为大数据分析系统基于实施步骤s7和步骤s8,结合候选交互会话的受影响偏好值确定候选交互会话的流量传递描述,进而结合候选交互会
话的流量传递描述确定候选活动行为事件的流量传递描述。
91.在一些独立的设计思路下,第一互联网用户行为大数据的数目大于1。行为大数据分析系统在实施步骤s4之前,还可以实施如下技术方案。
92.步骤s9:对所述x组第一互联网用户行为大数据进行引导状态识别,确定所述x个候选活动行为事件的x个引导状态指数。
93.对于本公开的一些示例而言,引导状态指数反映候选活动行为事件对应的流量引导系数,其中,流量引导系数包括:关注转移行为的执行方结束对候选活动行为事件进行关注吸引的累计时长,并且关注转移行为的执行方结束对候选活动行为事件进行关注吸引的累计时长越大,候选活动行为事件对应的流量引导系数越小。可以理解的是,行为大数据分析系统通过对x组第一互联网用户行为大数据进行引导状态识别,确定每个候选活动行为事件的引导状态指数,获得x个候选活动行为事件的x个引导状态指数。
94.对于一些可选的示例而言,行为大数据分析系统通过流量引导识别策略实现引导状态识别,其中,该流量引导识别策略通过将多组先验的互联网用户行为大数据作为调试示例,对相关神经网络进行调试获得。调试示例中的互联网用户行为大数据的先验知识包括:互联网用户行为大数据中的活动行为事件的引导状态指数。
95.在实施完步骤s9的条件下,行为大数据分析系统在实施步骤s4时可以通过如下技术方案实现。
96.步骤s10:结合所述x个第一行为注意力影响指数、所述x个流量传递描述和所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
97.对于一些可选的示例而言,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。活动行为事件的引导状态指数越大,活动行为事件对应的流量引导系数越大。行为大数据分析系统确定将第一行为注意力影响指数不小于行为注意力影响指数判定值,且流量传递描述不小于流量传递描述判定值,且引导状态指数不大于引导状态指数判定值的候选活动行为事件作为显著活动行为事件。
98.在其他的一些示例下,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。活动行为事件的引导状态指数越大,活动行为事件对应的流量引导系数越大。行为大数据分析系统结合第一行为注意力影响指数获得候选活动行为事件的行为注意力影响指数的命中因子,其中,行为注意力影响指数的命中因子与第一行为注意力影响指数满足第一设定关系。行为大数据分析系统将行为注意力影响指数的命中因子不小于行为注意力影响指数的命中因子判定值,且流量传递描述不小于流量传递描述判定值,且引导状态指数不大于引导状态指数判定值的候选活动行为事件作为显著活动行为事件。
99.在另外的一些示例下,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。活动行为事件的引导状态指数越大,活动行为事件对应的流量引导系数越大。举例而言,行为大数据分析系统结合第一行为注意力影响指数获得候选活动行为事件的行为注意力影响指数的命中因子,其中,行为注意力影响指数的命中因子与第一行为注意力影响指数满足第一设定关系。行为大数据分析系统结合流量传递描述获得候选活动行为事件的流量传递描述的命中因子,其中,流量传递描述的命中因子与流量传递描述满足第一设定关系。行为大数据分析系统结合引导状态指数获
得候选活动行为事件的流量引导命中因子,其中,流量引导命中因子与引导状态指数满足第二设定关系(比如满足负相关关系)。举例而言,行为大数据分析系统将行为注意力影响指数的命中因子不小于行为注意力影响指数的命中因子判定值,且流量传递描述的命中因子不小于流量传递描述的命中因子判定值,且流量引导命中因子不大于流量引导命中因子判定值的候选活动行为事件作为显著活动行为事件。
100.对于本公开的一些示例而言,行为大数据分析系统基于实施步骤s9和步骤s10,确定x个候选活动行为事件的x个引导状态指数,进而结合x个引导状态指数、x个流量传递描述和x个行为注意力影响指数从x个候选活动行为事件中确定x个显著活动行为事件,从而使x个显著活动行为事件的流量评分可更准确可信的反映会话关注流量评分。
101.在一些独立的设计思路下,行为大数据分析系统在实施步骤s1时可以通过如下技术方案实现。
102.步骤s11:对所述x组第一互联网用户行为大数据进行交互会话识别操作,获得所述x组第一互联网用户行为大数据中的x个候选交互会话的x个交互会话语义关键词,所述候选交互会话包括所述x个候选活动行为事件。
103.对于本公开的一些示例而言,第一互联网用户行为大数据中的交互会话为候选交互会话,x组第一互联网用户行为大数据包括x个候选交互会话。交互会话识别操作用于确定候选交互会话的交互会话语义关键词。比如,互联网用户行为大数据behavior_data_a包括候选交互会话candidate_session_a。行为大数据分析系统通过对互联网用户行为大数据behavior_data_a进行交互会话识别操作,确定交互会话session_a的交互会话语义关键词为跨境支付。
104.可以理解的是,行为大数据分析系统通过对x组第一互联网用户行为大数据进行交互会话识别操作,可获得x个候选交互会话的x个交互会话语义关键词。
105.进一步地,行为大数据分析系统通过交互会话识别策略实现交互会话识别操作,其中,交互会话识别策略通过将多组先验的互联网用户行为大数据作为调试示例,对相关神经网络进行调试获得。调试示例中的互联网用户行为大数据的先验知识包括:互联网用户行为大数据中的交互会话的交互会话语义关键词。
106.步骤s12:结合所述x个交互会话语义关键词,获得所述x个候选交互会话的x个第二行为注意力影响指数。
107.对于本公开的一些示例而言,对于一些可选的示例而言,行为大数据分析系统在实施步骤s12之前,确定第一迁移参考,其中,第一迁移参考反映交互会话语义关键词与行为注意力影响指数之间的迁移变换。在确定第一迁移参考后,行为大数据分析系统结合x个交互会话语义关键词和第一迁移参考,确定x个候选交互会话的第二行为注意力影响指数。
108.在其他的一些示例下,行为大数据分析系统结合x个交互会话语义关键词,确定x个候选交互会话的属性。在其他的一些示例下,行为大数据分析系统通过属性识别策略确定交互会话的属性,其中,属性识别策略通过将多组先验的互联网用户行为大数据作为调试示例,对相关神经网络进行调试获得。调试示例中的互联网用户行为大数据的先验知识包括:互联网用户行为大数据中的交互会话的属性。行为大数据分析系统确定第二迁移参考,其中,第二迁移参考反映属性与行为注意力影响指数之间的迁移变换。行为大数据分析系统结合x个候选交互会话的属性和第二迁移参考,获得x个候选交互会话的x个第二行为
注意力影响指数。
109.步骤s13:结合所述x个第二行为注意力影响指数,获得所述x个候选活动行为事件的x个第一行为注意力影响指数。
110.对于一些可选的示例而言,行为大数据分析系统将候选交互会话的第二行为注意力影响指数,作为候选交互会话对应的候选活动行为事件的第一行为注意力影响指数。
111.对于本公开的一些示例而言,行为大数据分析系统基于实施步骤s11~步骤s13,结合x个候选交互会话的x个交互会话语义关键词确定x个候选交互会话的x个第二行为注意力影响指数,进而结合x个第二行为注意力影响指数获得x个候选活动行为事件的x个第一行为注意力影响指数。
112.在一些独立的设计思路下,在第一互联网用户行为大数据的数目大于1的条件下,行为大数据分析系统在实施步骤s10之前还可以实施如下技术方案。
113.步骤s14、确定所述x个交互会话语义关键词的x个第一命中因子。
114.对于本公开的一些示例而言,第一命中因子为交互会话语义关键词的命中因子。比如,x个候选交互会话包括候选交互会话candidate_session_a。行为大数据分析系统确定候选交互会话candidate_session_a的交互会话语义关键词为协同办公,候选交互会话的交互会话语义关键词的第一命中因子为0.4,在这种情况下,候选交互会话candidate_session_a的交互会话语义关键词为协同办公的命中因子为0.4。
115.对于一些可选的示例而言,行为大数据分析系统在通过对x组第一互联网用户行为大数据进行交互会话识别操作,获得x个交互会话语义关键词的x个第一命中因子。
116.步骤s15:结合所述x个第一命中因子,获得所述x个候选活动行为事件的x个第二命中因子。
117.对于一些可选的示例而言,行为大数据分析系统将候选交互会话的第一命中因子作为候选交互会话对应的候选活动行为事件的第二命中因子。
118.在实施完步骤s14的条件下,行为大数据分析系统在实施步骤s10时可以通过如下技术方案实现:
119.步骤s16:结合所述x个第一行为注意力影响指数、所述x个流量传递描述、所述x个引导状态指数和所述x个第一命中因子,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
120.对于一些可选的示例而言,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。活动行为事件的引导状态指数越大,活动行为事件对应的流量引导系数越大。
121.对于一些可选的示例而言,行为大数据分析系统结合第一行为注意力影响指数获得候选活动行为事件的行为注意力影响指数的命中因子,其中,行为注意力影响指数的命中因子与第一行为注意力影响指数满足第一设定关系。行为大数据分析系统结合流量传递描述获得候选活动行为事件的流量传递描述的命中因子,其中,流量传递描述的命中因子与流量传递描述满足第一设定关系。行为大数据分析系统结合引导状态指数获得候选活动行为事件的流量引导命中因子,其中,流量引导命中因子与引导状态指数满足第二设定关系。
122.对于一些可选的示例而言,行为大数据分析系统将行为注意力影响指数的命中因
子不小于行为注意力影响指数的命中因子判定值,且流量传递描述的命中因子不小于流量传递描述的命中因子判定值,且流量引导命中因子不大于流量引导命中因子判定值,且第二命中因子不小于语义关键词命中因子判定值的候选活动行为事件作为显著活动行为事件。
123.在其他的一些示例下,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。活动行为事件的引导状态指数越大,活动行为事件对应的流量引导系数越大。行为大数据分析系统结合第一行为注意力影响指数获得候选活动行为事件的行为注意力影响指数的命中因子,其中,行为注意力影响指数的命中因子与第一行为注意力影响指数满足第一设定关系。行为大数据分析系统结合流量传递描述获得候选活动行为事件的流量传递描述的命中因子,其中,流量传递描述的命中因子与流量传递描述满足第一设定关系。行为大数据分析系统结合引导状态指数获得候选活动行为事件的流量引导命中因子,其中,流量引导命中因子与引导状态指数满足第二设定关系。行为大数据分析系统确定行为注意力影响指数的命中因子的第一偏置系数、流量传递描述的命中因子的第二偏置系数、流量引导命中因子的第三偏置系数、第二命中因子的第四偏置系数。结合第一偏置系数、第二偏置系数、第三偏置系数和第四偏置系数,对x个行为注意力影响指数的命中因子、x个流量传递描述的命中因子、x个流量引导命中因子和x个第二命中因子进行全局计算(比如加权),获得x个候选活动行为事件的x个目标命中因子。行为大数据分析系统确定目标命中因子不小于目标命中因子判定值的候选活动行为事件为显著活动行为事件。比如,x个候选活动行为事件包括候选活动行为事件candidate_case_a和候选活动行为事件candidate_case_b,第一偏置系数为0.15,第二偏置系数为0.2,第三偏置系数为0.1,第四偏置系数为0.05。若候选活动行为事件candidate_case_a的行为注意力影响指数的命中因子为0.4,候选活动行为事件candidate_case_a的流量传递描述的命中因子为0.45,候选活动行为事件candidate_case_a的流量引导命中因子为0.3,候选活动行为事件candidate_case_a的第二命中因子为0.35,候选活动行为事件candidate_case_b的行为注意力影响指数的命中因子为0.3,候选活动行为事件candidate_case_b的流量传递描述的命中因子为0.4,候选活动行为事件candidate_case_b的流量引导命中因子为0.45,候选活动行为事件candidate_case_b的第二命中因子为0.4。
124.在上述内容的基础上,候选活动行为事件candidate_case_a的目标命中因子=0.4*0.15+0.45*0.2+0.3*0.1+0.36*0.02=0.395。
125.进一步地,候选活动行为事件candidate_case_b的目标命中因子=0.3*0.15+0.4*0.2+0.45*0.1+0.4*0.05=0.38。若目标命中因子判定值为0.39,那么候选活动行为事件candidate_case_a为显著活动行为事件,候选活动行为事件candidate_case_b不是显著活动行为事件。
126.在另外的一些示例下,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。活动行为事件的引导状态指数越大,活动行为事件对应的流量引导系数越大。行为大数据分析系统将行为注意力影响指数不小于行为注意力影响指数判定值,且流量传递描述不小于流量传递描述判定值,且引导状态指数不大于引导状态指数判定值,且第二命中因子不小于第二命中因子判定值的候选活动行为事件作为显著活动行为事件。
127.对于本公开的一些示例而言,行为大数据分析系统基于实施步骤s14~步骤s16,确定x个候选活动行为事件的x个第二命中因子,进而结合x个第二命中因子、x个引导状态指数、x个流量传递描述和x个行为注意力影响指数从x个候选活动行为事件中确定x个显著活动行为事件,从而使x个显著活动行为事件的流量评分可更准确可信的反映会话关注流量评分。
128.在一些独立的设计思路下,本公开实施例还提供了另一种从x组第一互联网用户行为大数据中确定x个显著活动行为事件的设计思路,行为大数据分析系统在实施步骤s202时可以通过如下技术方案实现。
129.步骤s17:对所述x组第一互联网用户行为大数据进行流量评分持续性识别,确定所述x个候选活动行为事件的x个流量传递描述。
130.步骤s18:结合所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
131.对于一些可选的示例而言,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。行为大数据分析系统确定将流量传递描述不小于流量传递描述判定值的候选活动行为事件作为显著活动行为事件。
132.在其他的一些示例下,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。行为大数据分析系统结合流量传递描述获得候选活动行为事件的流量传递描述的命中因子,其中,流量传递描述的命中因子与流量传递描述满足第一设定关系。行为大数据分析系统将流量传递描述的命中因子不小于流量传递描述的命中因子判定值的候选活动行为事件作为显著活动行为事件。
133.对于本公开的一些示例而言,行为大数据分析系统基于实施步骤s17和步骤s18,确定x个候选活动行为事件的x个流量传递描述,进而结合x个流量传递描述从x个候选活动行为事件中确定x个显著活动行为事件,从而使x个显著活动行为事件的流量评分可更准确可靠的反映会话关注流量评分。
134.在一些独立的设计思路下,行为大数据分析系统在实施步骤s18之前,还可以实施如下技术方案。
135.步骤s19:对所述x组第一互联网用户行为大数据进行引导状态识别,确定所述x个候选活动行为事件的x个引导状态指数。
136.在获得x个候选活动行为事件的x个第一行为注意力影响指数后,行为大数据分析系统在实施步骤s18时可以通过如下技术方案实现。
137.步骤s20:结合所述x个引导状态指数和所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
138.对于一些可选的示例而言,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。活动行为事件的引导状态指数越大,活动行为事件对应的流量引导系数越大。行为大数据分析系统将流量传递描述不小于流量传递描述判定值,且引导状态指数不大于引导状态指数判定值的候选活动行为事件作为显著活动行为事件。
139.在其他的一些示例下,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。活动行为事件的引导状态指数越大,活动
行为事件对应的流量引导系数越大。行为大数据分析系统将流量传递描述不小于流量传递描述判定值,且引导状态指数不大于引导状态指数判定值的候选活动行为事件作为显著活动行为事件。在另外的一些示例下,活动行为事件的流量传递描述越大,活动行为事件的流量评分与在线会话的流量评分的相关性系数越大。活动行为事件的引导状态指数越大,活动行为事件对应的流量引导系数越大。行为大数据分析系统结合流量传递描述获得候选活动行为事件的流量传递描述的命中因子,其中,流量传递描述的命中因子与流量传递描述满足第一设定关系。
140.行为大数据分析系统结合引导状态指数获得候选活动行为事件的流量引导命中因子,其中,流量引导命中因子与引导状态指数满足第二设定关系。
141.行为大数据分析系统将流量传递描述的命中因子不小于流量传递描述的命中因子判定值,且流量引导命中因子不大于流量引导命中因子判定值的候选活动行为事件作为显著活动行为事件。
142.在一些独立的设计思路下,本公开实施例还提供了又一种从x组第一互联网用户行为大数据中确定x个显著活动行为事件的设计思路,行为大数据分析系统在实施步骤s202时可以通过如下技术方案实现。
143.步骤s21:对所述x组第一互联网用户行为大数据进行引导状态识别,确定所述x个候选活动行为事件的x个引导状态指数。步骤s22:结合所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
144.对于一些可选的示例而言,活动行为事件的引导状态指数越大,活动行为事件对应的流量引导系数越大。行为大数据分析系统确定引导状态指数不大于引导状态指数判定值的候选活动行为事件为显著活动行为事件。在其他的一些示例下,活动行为事件的引导状态指数越大,活动行为事件对应的流量引导系数越大。行为大数据分析系统结合引导状态指数获得候选活动行为事件的流量引导命中因子,其中,流量引导命中因子与引导状态指数满足第二设定关系。行为大数据分析系统确定流量引导命中因子不大于流量引导命中因子判定值的候选活动行为事件为显著活动行为事件。
145.对于本公开的一些示例而言,行为大数据分析系统基于实施步骤s21和步骤s22,确定x个候选活动行为事件的x个引导状态指数,进而结合x个引导状态指数从x个候选活动行为事件中确定x个显著活动行为事件,从而使x个显著活动行为事件的流量评分能够精准可靠地反映会话关注流量评分。
146.在一些独立的设计思路下,行为大数据分析系统在实施步骤s22之前,还可以实施如下技术方案。
147.步骤s23:对所述x组第一互联网用户行为大数据进行行为注意力影响指数识别操作,确定所述x组第一互联网用户行为大数据中的x个候选活动行为事件的x个第一行为注意力影响指数。
148.在获得x个候选活动行为事件的x个第一行为注意力影响指数后,行为大数据分析系统在实施步骤s22时可以通过如下技术方案实现。
149.步骤s24:结合所述x个第一行为注意力影响指数和所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。
150.对于一些可选的示例而言,活动行为事件的引导状态指数越大,活动行为事件对
应的流量引导系数越大。行为大数据分析系统将第一行为注意力影响指数不小于行为注意力影响指数判定值,且引导状态指数不大于引导状态指数判定值的候选活动行为事件作为显著活动行为事件。
151.在其他的一些示例下,行为大数据分析系统结合第一行为注意力影响指数获得候选活动行为事件的行为注意力影响指数的命中因子,其中,行为注意力影响指数的命中因子与第一行为注意力影响指数满足第一设定关系。活动行为事件的引导状态指数越大,活动行为事件对应的流量引导系数越大。行为大数据分析系统将行为注意力影响指数的命中因子不小于行为注意力影响指数的命中因子判定值,且引导状态指数不大于引导状态指数判定值的候选活动行为事件作为显著活动行为事件。在另外的一些示例下,活动行为事件的引导状态指数越大,活动行为事件对应的流量引导系数越大。行为大数据分析系统结合第一行为注意力影响指数获得候选活动行为事件的行为注意力影响指数的命中因子,其中,行为注意力影响指数的命中因子与第一行为注意力影响指数满足第一设定关系。行为大数据分析系统结合引导状态指数获得候选活动行为事件的流量引导命中因子,其中,流量引导命中因子与引导状态指数满足第二设定关系。行为大数据分析系统将行为注意力影响指数的命中因子不小于行为注意力影响指数的命中因子判定值,且流量引导命中因子不大于流量引导命中因子判定值的候选活动行为事件作为显著活动行为事件。
152.在一些独立的设计思路下,所述待分析在线会话包括满足流量分析要求的交互会话。对于本公开的一些示例而言,满足流量分析要求的交互会话符合如下一项或多项要求:特征维度不大于第一判定值、行为注意力影响指数不小于第二判定值、受影响偏好值不大于第三判定值。即在对于本公开的一些示例而言,使用预设数据处理线程测量获得的满足流量分析要求的交互会话的流量评分可反映待分析在线会话的会话关注流量评分。
153.可以选择的是,行为大数据分析系统在实施步骤s202时可以通过如下技术方案实现。
154.步骤s25:对所述x组第一互联网用户行为大数据进行目标识别操作,获得所述满足流量分析要求的交互会话在所述x组第一互联网用户行为大数据中的所关联的x个行为大数据集。
155.本公开实施中,目标识别操作用于从互联网用户行为大数据中确定满足流量分析要求的交互会话。比如,满足流量分析要求的交互会话为智慧教育课程咨询。目标识别操作用于从互联网用户行为大数据中确定智慧教育课程咨询。行为大数据分析系统通过对x组第一互联网用户行为大数据进行目标识别操作,可从x组第一互联网用户行为大数据中确定满足流量分析要求的交互会话,进而获得满足流量分析要求的交互会话在x组第一互联网用户行为大数据中的所关联的x个行为大数据集。
156.步骤s26:从所述x个行为大数据集中确定x个活动行为事件作为所述x个显著活动行为事件。
157.比如,x个行为大数据集包括活动行为事件activity_case_a、活动行为事件activity_case_b、活动行为事件activity_case_c和活动行为事件activity_case_d。行为大数据分析系统可从活动行为事件activity_case_a、活动行为事件activity_case_b、活动行为事件activity_case_c和活动行为事件activity_case_d中确定x个活动行为事件作为x个显著活动行为事件。
158.对于本公开的一些示例而言,行为大数据分析系统基于实施步骤s25和步骤s26,可通过对x组第一互联网用户行为大数据进行目标识别操作,从x组第一互联网用户行为大数据中确定x个显著活动行为事件,进而缓解确定x个显著活动行为事件的处理资源压力。并且鉴于使用预设数据处理线程解析获得的满足流量分析要求的交互会话的流量评分可反映待分析在线会话的会话关注流量评分,基于实施步骤s25和步骤s26确定x个显著活动行为事件,可使x个显著活动行为事件的流量评分能够精准可靠地反映会话关注流量评分。
159.对于另一些可独立实施的实施例而言,行为大数据分析系统在基于实施步骤s16确定x个候选活动行为事件中不存在显著活动行为事件的条件下,基于实施步骤s25和步骤s26从x组第一互联网用户行为大数据中确定x个显著活动行为事件。
160.在一些独立的设计思路下,第一流量评分的数目大于1,即显著活动行为事件的数目大于1。在这种情况下,行为大数据分析系统在实施步骤s204时可以通过如下技术方案实现。
161.步骤s27:分别确定x个第一流量评分与所述会话关注流量评分的量化分析结果,获得y个第二流量评分。
162.在一些示例性的情况下,x个第一流量评分可以包括第一流量评分network_flow_value_a和第一流量评分network_flow_value_b。行为大数据分析系统可以确定第一流量评分network_flow_value_a与会话关注流量评分的量化分析结果,以获得第二流量评分network_flow_value_c,然后确定第一流量评分network_flow_value_b与会话关注流量评分的量化分析结果获得第二流量评分network_flow_value_d。在这种情况下,x个第二流量评分包括:第二流量评分network_flow_value_c,以及第二流量评分network_flow_value_d。
163.步骤s28:对所述y个第二流量评分进行清洗操作,获得x个第三流量评分。
164.对于本公开的一些示例而言,清洗操作用于过滤y个第二流量评分中的扰动值。对于一些可选的示例而言,行为大数据分析系统计算y个第二流量评分的全局量化结果,获得第一过渡结果(比如可以理解为中间结果)。过滤y个第二流量评分中与第一过渡结果之间的指定计算值(比如绝对值)最大的第二流量评分,获得x个第三流量评分。在其他的一些示例下,行为大数据分析系统确定y个第二流量评分的离散指数,获得第二过渡结果。过滤y个第二流量评分中与第二过渡结果之间的指定计算值最大的第二流量评分,获得x个第三流量评分。在另外的一些示例下,第二流量评分的数目大于2。行为大数据分析系统过滤y个第二流量评分中的max和min,获得x个第三流量评分。
165.比如,x个第二流量评分包括:第二流量评分network_flow_value_a;第二流量评分network_flow_value_b;第二流量评分network_flow_value_c;第二流量评分network_flow_value_d。其中,第二流量评分network_flow_value_a为17.5,第二流量评分network_flow_value_b为16,第二流量评分network_flow_value_c为15.5,第二流量评分network_flow_value_d为16.2。在这种情况下,x个第二流量评分的max为17.5,x个第二流量评分的min为15.5。过滤x个第二流量评分的max和min,获得的x个第三流量评分可以包括第二流量评分network_flow_value_b为16和第二流量评分network_flow_value_d为16.2。
166.步骤s29:确定所述x个第三流量评分的全局量化结果,获得所述流量分析性能。
167.对于本公开的一些示例而言,行为大数据分析系统基于实施步骤s27~步骤s29,
过滤y个第二流量评分中的扰动值,获得x个第三流量评分,进而通过确定x个第三流量评分的全局量化结果获得流量分析性能,可提高流量分析性能的可信度。
168.对于另一些可独立实施的实施例而言,在确定所述预设数据处理线程的流量分析性能之后,该方法还可以包括如下技术方案:根据所述流量分析性能对所述预设数据处理线程进行线程参数改进,得到已优化数据处理线程;通过所述已优化数据处理线程捕捉目标在线会话的第三互联网用户行为大数据;对所述第三互联网用户行为大数据进行用户需求分析,得到用户需求分析结果;基于所述用户需求分析结果进行信息推送。可以理解的是,通过对所述预设数据处理线程进行线程参数改进,能够保障已优化数据处理线程针对目标在线会话捕捉得到的第三互联网用户行为大数据的流量评分的精度和可信度,这样一来,通过对第三互联网用户行为大数据进行用户需求分析,能够得到更为准确的用户需求分析结果,进而指导后续的针对性和高效性的信息推送。
169.对于另一些可独立实施的实施例而言,对所述第三互联网用户行为大数据进行用户需求分析,得到用户需求分析结果,可以包括如下内容:通过所述已优化数据处理线程确定所述目标在线会话的目标会话关注流量评分;基于所述会话关注流量评分对所述第三互联网用户行为大数据进行采样,得到待处理行为大数据;依据所述待处理行为大数据获得所述用户需求分析结果。可以理解的是,通过会话关注流量评分能够精准定位具有需求分析价值的行为大数据集(比如上述的待处理行为大数据),这样可以通过待处理行为大数据获得完整准确的用户需求分析结果。
170.对于另一些可独立实施的实施例而言,依据所述待处理行为大数据获得所述用户需求分析结果,可以包括如下内容:依据所述待操作行为大数据获得第一行为习惯特征分布;对所述第一行为习惯特征分布进行多类兴趣倾向方面中每类兴趣倾向方面下的兴趣倾向挖掘操作,得到所述第一行为习惯特征分布的多类备选兴趣倾向;通过所述第一行为习惯特征分布的多类备选兴趣倾向,挖掘所述第一行为习惯特征分布的目标兴趣倾向,其中,所述目标兴趣倾向用作兴趣倾向衍生分析操作;利用目标兴趣倾向确定所述待操作行为大数据对应的所述用户需求分析结果。如此一来,通过考虑不同方面的兴趣倾向,能够实现对兴趣倾向以及相关用户需求的衍生分析,从而得到完整准确的用户需求分析结果。
171.对于另一些可独立实施的实施例而言,所述通过所述第一行为习惯特征分布的多类备选兴趣倾向,挖掘所述第一行为习惯特征分布的目标兴趣倾向,包括:通过所述多类备选兴趣倾向分别匹配的动态检测指标,从所述多类备选兴趣倾向中确定所述目标兴趣倾向,所述动态检测指标表征匹配的备选兴趣倾向在用户需求分析网络优化隐藏层参数后所获得的行为习惯特征分布中相比于在用户需求分析网络优化隐藏层参数前所获得的行为习惯特征分布中的差别,所述用户需求分析网络用于通过所述隐藏层参数获得行为习惯特征分布。如此一来,可以保障行为习惯特征分布的完整性,避免行为习惯特征分布出现局部缺失。
172.图3是示出可以实现本公开的实施例的聚焦互联网流量的行为大数据分析方法的应用环境的架构示意图,聚焦互联网流量的行为大数据分析方法的应用环境中可以包括互相通信的行为大数据分析系统100和互联网会话终端200。基于此,行为大数据分析系统100和互联网会话终端200在运行时实现或者部分实现本公开实施例的聚焦互联网流量的行为大数据分析方法。
173.以上所述,仅为本公开的较佳实施例而已,并非用于限定本公开的保护范围。

技术特征:
1.一种聚焦互联网流量的行为大数据分析方法,其中,所述方法由行为大数据分析系统实施,所述方法至少包括:收集待分析在线会话的会话关注流量评分、所述待分析在线会话的x组第一互联网用户行为大数据、与所述x组第一互联网用户行为大数据指向的x组第二互联网用户行为大数据;其中,所述x组第一互联网用户行为大数据包含如下一种或多种:视觉行为大数据、语音行为大数据,所述x组第二互联网用户行为大数据通过预设数据处理线程捕捉所得,x为正整数;从所述x组第一互联网用户行为大数据中确定x个显著活动行为事件;其中,所述x个显著活动行为事件包含流量评分反映所述待分析在线会话的流量评分的活动行为事件;结合所述x组第一互联网用户行为大数据和所述x组第二互联网用户行为大数据之间的x个对应指示以及x个目标分布标识,获得所述x个显著活动行为事件的x个第一流量评分;其中,所述x个目标分布标识为所述x个显著活动行为事件在所述x组第一互联网用户行为大数据中的分布标识;结合所述x个第一流量评分和所述会话关注流量评分之间的比较结果,确定所述预设数据处理线程的流量分析性能。2.根据权利要求1所述的方法,其中,所述从所述x组第一互联网用户行为大数据中确定x个显著活动行为事件,包括:对所述x组第一互联网用户行为大数据进行行为注意力影响指数识别操作,确定所述x组第一互联网用户行为大数据中的x个候选活动行为事件的x个第一行为注意力影响指数;结合所述x个第一行为注意力影响指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。3.根据权利要求2所述的方法,其中,在所述结合所述x个第一行为注意力影响指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件之前,所述方法还包括:对所述x组第一互联网用户行为大数据进行流量评分持续性识别,确定所述x个候选活动行为事件的x个流量传递描述,所述流量传递描述反映所述候选活动行为事件的流量评分与所述待分析在线会话的流量评分的相关性系数;所述结合所述x个第一行为注意力影响指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件,包括:结合所述x个第一行为注意力影响指数和所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。4.根据权利要求3所述的方法,其中,所述对所述x组第一互联网用户行为大数据进行流量评分持续性识别,确定所述x个候选活动行为事件的x个流量传递描述,包括:对所述x组第一互联网用户行为大数据进行特征维度识别操作,获得所述x组第一互联网用户行为大数据中x个候选交互会话的x个特征维度,所述x个候选交互会话包括所述x个候选活动行为事件;结合所述x个特征维度,获得所述x个流量传递描述,所述候选交互会话的特征维度越少,所述候选交互会话的流量评分与所述待分析在线会话的流量评分的相关性系数越大。5.根据权利要求3所述的方法,其中,所述对所述x组第一互联网用户行为大数据进行流量评分持续性识别,确定所述x个候选活动行为事件的x个流量传递描述,包括:对所述x组第一互联网用户行为大数据进行受影响偏好值识别操作,获得所述x组第一
互联网用户行为大数据中x个候选交互会话的x个受影响偏好值,所述x个候选交互会话包括所述x个候选活动行为事件;结合所述x个受影响偏好值,获得所述x个流量传递描述,所述候选交互会话的受影响偏好值越少,所述候选交互会话的流量评分与所述待分析在线会话的流量评分的相关性系数越大;其中,所述第一互联网用户行为大数据的数目大于1,所述结合所述x个第一行为注意力影响指数和所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件之前,所述方法还包括:对所述x组第一互联网用户行为大数据进行引导状态识别,确定所述x个候选活动行为事件的x个引导状态指数,所述引导状态指数反映所述候选活动行为事件对应的流量引导系数;所述结合所述x个第一行为注意力影响指数和所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件,包括:结合所述x个第一行为注意力影响指数、所述x个流量传递描述和所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件;其中,所述对所述x组第一互联网用户行为大数据进行行为注意力影响指数识别操作,确定所述x组第一互联网用户行为大数据中的x个候选活动行为事件的x个第一行为注意力影响指数,包括:对所述x组第一互联网用户行为大数据进行交互会话识别操作,获得所述x组第一互联网用户行为大数据中的x个候选交互会话的x个交互会话语义关键词,所述候选交互会话包括所述x个候选活动行为事件;结合所述x个交互会话语义关键词,获得所述x个候选交互会话的x个第二行为注意力影响指数;结合所述x个第二行为注意力影响指数,获得所述x个候选活动行为事件的所述x个第一行为注意力影响指数;其中,在所述第一互联网用户行为大数据的数目大于1的条件下,所述结合所述x个第一行为注意力影响指数、所述x个流量传递描述和所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件之前,所述方法还包括:确定所述x个交互会话语义关键词的x个第一命中因子;结合所述x个第一命中因子,获得所述x个候选活动行为事件的x个第二命中因子;所述结合所述x个第一行为注意力影响指数、所述x个流量传递描述和所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件,包括:结合所述x个第一行为注意力影响指数、所述x个流量传递描述、所述x个引导状态指数和所述x个第二命中因子,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。6.根据权利要求1所述的方法,其中,所述从所述x组第一互联网用户行为大数据中确定x个显著活动行为事件,包括:对所述x组第一互联网用户行为大数据进行流量评分持续性识别,确定所述x个候选活动行为事件的x个流量传递描述,所述流量传递描述反映所述候选活动行为事件的流量评分与所述待分析在线会话的流量评分的相关性系数;结合所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件;其中,在所述结合所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件之前,所述方法还包括:对所述x组第一互联网用户行为大数据进行引导
状态识别,确定所述x个候选活动行为事件的x个引导状态指数,所述引导状态指数反映所述候选活动行为事件对应的流量引导系数;所述结合所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件,包括:结合所述x个引导状态指数和所述x个流量传递描述,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。7.根据权利要求1所述的方法,其中,所述从所述x组第一互联网用户行为大数据中确定x个显著活动行为事件,包括:对所述x组第一互联网用户行为大数据进行引导状态识别,确定所述x个候选活动行为事件的x个引导状态指数,所述引导状态指数反映所述候选活动行为事件对应的流量引导系数;结合所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件;其中,在结合所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件之前,所述方法还包括:对所述x组第一互联网用户行为大数据进行行为注意力影响指数识别操作,确定所述x组第一互联网用户行为大数据中的x个候选活动行为事件的x个第一行为注意力影响指数;所述结合所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件,包括:结合所述x个第一行为注意力影响指数和所述x个引导状态指数,从所述x个候选活动行为事件中确定所述x个显著活动行为事件。8.根据权利要求1所述的方法,其中,所述待分析在线会话包括满足流量分析要求的交互会话,所述满足流量分析要求的交互会话符合如下一项或多项要求:特征维度不大于第一判定值、行为注意力影响指数不小于第二判定值、受影响偏好值不大于第三判定值;所述从所述x组第一互联网用户行为大数据中确定x个显著活动行为事件,包括:对所述x组第一互联网用户行为大数据进行目标识别操作,获得所述满足流量分析要求的交互会话在所述x组第一互联网用户行为大数据中的所关联的x个行为大数据集;从所述x个行为大数据集中确定x个活动行为事件作为所述x个显著活动行为事件。9.根据权利要求1所述的方法,其中,第一流量评分的数目大于1的条件下,所述结合所述x个第一流量评分和所述会话关注流量评分之间的比较结果,确定所述预设数据处理线程的流量分析性能,包括:分别确定x个第一流量评分与所述会话关注流量评分的量化分析结果,获得y个第二流量评分,y为大于1的整数;对所述y个第二流量评分进行清洗操作,获得x个第三流量评分;确定所述x个第三流量评分的全局量化结果,获得所述流量分析性能。10.一种行为大数据分析系统,其中,包括:用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现权利要求1-9任一项所述的方法的处理器。

技术总结
本公开实施例公开了聚焦互联网流量的行为大数据分析方法及系统,在从X组第一互联网用户行为大数据中确定X个显著活动行为事件的条件下,结合X组第二互联网用户行为大数据确定X个显著活动行为事件的X个第一流量评分,结合X个第一流量评分与会话关注流量评分之间的比较结果获得预设数据处理线程的流量分析性能,不仅能确保对流量分析性能进行确定的精度和可信度,还能提高流量分析性能的确定时效性,减少不必要的资源开销,可通过流量分析性能对预设数据处理线程进行调整优化,保障后续在应用该预设数据处理线程时可以尽量提高流量分析精度和可信度,确保不同来源的行为大数据之间的流量分析偏移最小化,以便实现高质量的互联网流量分析。的互联网流量分析。的互联网流量分析。


技术研发人员:李明
受保护的技术使用者:李明
技术研发日:2022.04.01
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-1811.html

最新回复(0)