用户对item的点击行为。用户关联用户特征,item关联item特征。
用户特征*item特征,例如用户年纪*item类目,将其进行编码,构成交叉特征。
交叉特征:哪个年龄段的人更偏爱哪个商品类目。
代码如下
import pandas as pd
# 用户表
user_data = {
'UserID': [1, 2, 3],
'Age': [24, 30, 22],
'Gender': ['M', 'F', 'M']
}
# 商品表
item_data = {
'ItemID': [101, 102, 103],
'Category': ['Electronics', 'Clothing', 'Books'],
'Price': [299, 49, 15]
}
# 转换为DataFrame
user_df = pd.DataFrame(user_data)
item_df = pd.DataFrame(item_data)
# 定义年龄段
def age_group(age):
if 20 <= age <= 25:
return 'Young'
elif 26 <= a