我打算做一个pairwise的learning to rank,有数据,但是怎么做预处理呢?因为每个样本的feature都是同样格式的,所以如果直接使用的话,就是把两个数据合并起来,比如说
feature1_A feature2_A feature1_B feature2_B label
有什么好的预处理方法吗?
还有一个问题是,如果把A和B交换一下,那么label也就从1变成0或者从0变成1了。对于一个pair,我是产生两行数据(一个label是0,一个是1),还是就随机产生一条呢?
谢谢!
我打算做一个pairwise的learning to rank,有数据,但是怎么做预处理呢?因为每个样本的feature都是同样格式的,所以如果直接使用的话,就是把两个数据合并起来,比如说
feature1_A feature2_A feature1_B feature2_B label
有什么好的预处理方法吗?
还有一个问题是,如果把A和B交换一下,那么label也就从1变成0或者从0变成1了。对于一个pair,我是产生两行数据(一个label是0,一个是1),还是就随机产生一条呢?
谢谢!